Представлен TOUCAN — крупнейший открытый набор данных для обучения AI-агентов
Исследователи выпустили TOUCAN — крупнейший открытый набор данных с 1,5 млн реальных взаимодействий для обучения AI-агентов работе с инструментами.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Исследователи выпустили TOUCAN — крупнейший открытый набор данных с 1,5 млн реальных взаимодействий для обучения AI-агентов работе с инструментами.
Фреймворк ReasoningBank позволяет ИИ-агентам учиться на успехах и ошибках, повышая эффективность решения задач на 8.3% и сокращая операционные затраты вдвое.
OpenAI планирует преобразовать ChatGPT в платформу, похожую на операционную систему, с интеграцией приложений от сторонних разработчиков для 800 млн пользователей.
Google представил Gemini 2.5 Computer Use — ИИ-модель для управления пользовательскими интерфейсами. Агенты могут кликать, вводить текст и выполнять задачи в веб-приложениях.
AI21 Labs выпустила Jamba Reasoning 3B — компактную модель с открытым кодом для локального использования. Архитектура SSM-Transformer обеспечивает эффективность в 2-5 раз выше конкурентов.
IBM и Anthropic объявили о партнерстве по интеграции Claude в инструменты разработки, обещая 45% рост продуктивности при соблюдении стандартов безопасности.
Perplexity готовится запустить GPT-5 Pro для пользователей Max-подписки, усиливая конкуренцию с ChatGPT Pro и предоставляя доступ к самой мощной модели OpenAI.
Растет тревожная тенденция: близкие вместо психолога рекомендуют ChatGPT и аналогичные ИИ. Дешево и доступно, но риски некорректных диагнозов и утечки данных серьезны.
AWS запускает глобальную межрегиональную инфраструктуру для Claude Sonnet в Amazon Bedrock, позволяя распределять инференс-нагрузку между регионами для снижения задержек и повышения отказоустойчивости.
Корейский стартап Wrtn достиг 6,5 млн пользователей, создав экосистему AI-приложений для повседневной жизни на базе GPT-5 с глубокой локализацией для азиатского рынка.