Google запускает кэширование контекста для Vertex AI
Google представил кэширование контекста для Vertex AI — технологию, снижающую затраты на обработку длинных промптов до 80% и ускоряющую работу языковых моделей.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Google представил кэширование контекста для Vertex AI — технологию, снижающую затраты на обработку длинных промптов до 80% и ускоряющую работу языковых моделей.
Anthropic выпустила Claude Haiku 4.5 — компактную модель ИИ, которая по производительности в программировании сравнима с флагманской Sonnet 4, но работает в 2 раза быстрее и стоит на 67% дешевле.
Сэм Альтман признает провал GPT-5, но обещает прорыв в GPT-6. Эксперты критикуют скромные улучшения модели и ставят под сомнение стратегию масштабирования OpenAI.
Обзор самых разочаровывающих запусков ИИ в 2025 году: от GPT-5 до Meta* Vibes. Почему обещания не совпали с реальностью и что пошло не так у лидеров индустрии.
Новый фреймворк EAGLET улучшает производительность AI-агентов на длинных задачах с помощью генерации планов, повышая эффективность выполнения на 20+ процентных пунктов без переобучения моделей.
OpenAI возвращает ChatGPT человечность и разрешает эротические беседы для взрослых пользователей после критики о чрезмерных ограничениях.
OpenAI борется с политической предвзятостью ChatGPT, предотвращая автоматическое согласие с взглядами пользователей и создавая более объективный ИИ.
Google внедряет Gemini AI в Gmail для автоматического планирования встреч. Новая функция анализирует переписку и предлагает оптимальное время, но пока только для индивидуальных переговоров.
Salesforce и Anthropic расширяют партнерство для интеграции Claude в платформу Agentforce, ориентируясь на финансовые услуги, здравоохранение и другие регулируемые отрасли с повышенными требованиями к безопасности.
Salesforce перешла на Amazon Bedrock для развертывания кастомизированных LLM, сократив время вывода моделей в продакшен с месяцев до часов и устранив необходимость резервирования GPU-мощностей.