OpenAI опубликовала исследование о политических предпочтениях языковых моделей
OpenAI представила исследование политических предпочтений языковых моделей, разработав методологию оценки предвзятости ИИ-систем.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
OpenAI представила исследование политических предпочтений языковых моделей, разработав методологию оценки предвзятости ИИ-систем.
GPT-4.5 демонстрирует прогностические способности на уровне человеческих суперпрогнозистов. Согласно бенчмарку, ИИ может достичь полного паритета с лучшими прогнозистами в течение года.
Cohere запустила партнерскую программу для создания экосистемы вокруг своих языковых моделей. Участники получат доступ к техническим ресурсам и совместным маркетинговым возможностям.
Google представила ИИ-агента Gemini 2.5 Pro Computer Use, который автономно работает в браузере: заполняет формы, нажимает кнопки и проходит капчи.
Исследователи выпустили TOUCAN — крупнейший открытый набор данных с 1,5 млн реальных взаимодействий для обучения AI-агентов работе с инструментами.
Фреймворк ReasoningBank позволяет ИИ-агентам учиться на успехах и ошибках, повышая эффективность решения задач на 8.3% и сокращая операционные затраты вдвое.
OpenAI планирует преобразовать ChatGPT в платформу, похожую на операционную систему, с интеграцией приложений от сторонних разработчиков для 800 млн пользователей.
Google представил Gemini 2.5 Computer Use — ИИ-модель для управления пользовательскими интерфейсами. Агенты могут кликать, вводить текст и выполнять задачи в веб-приложениях.
AI21 Labs выпустила Jamba Reasoning 3B — компактную модель с открытым кодом для локального использования. Архитектура SSM-Transformer обеспечивает эффективность в 2-5 раз выше конкурентов.
IBM и Anthropic объявили о партнерстве по интеграции Claude в инструменты разработки, обещая 45% рост продуктивности при соблюдении стандартов безопасности.