Microsoft учит ИИ-агентов терпению с помощью технологии SentinelStep
Microsoft представила SentinelStep — технологию, которая учит ИИ-агентов терпению и стратегическому ожиданию при выполнении длительных задач мониторинга.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Microsoft представила SentinelStep — технологию, которая учит ИИ-агентов терпению и стратегическому ожиданию при выполнении длительных задач мониторинга.
OpenAI представила ChatGPT Atlas — браузер со встроенным ИИ-помощником, способным автоматизировать задачи, запоминать контекст и работать непосредственно в интернете.
Открытая модель gpt-oss-120b впервые достигла уровня золотой медали на Международной олимпиаде по информатике благодаря фреймворку GenCluster, масштабирующему тестовые вычисления.
Новая архитектура Ling 2.0 Sparse объединяет разреженные механизмы внимания с Mixture of Experts, обеспечивая трехкратное ускорение обработки длинных контекстов в языковых моделях.
Исследователь OpenAI заявил о решении задач Эрдёша с помощью GPT-5, но оказалось, что система просто нашла готовые ответы в интернете.
Anthropic представила специализированное решение Claude для наук о жизни с интеграциями научных платформ, улучшенными показателями в биомедицинских задачах и партнерствами с ведущими консалтинговыми компаниями.
Фреймворк SwiReasoning от Georgia Tech и Microsoft учит языковые модели переключаться между явными и скрытыми режимами рассуждения, повышая точность на 2,8% и эффективность токенов в 6,8 раз.
Сооснователь OpenAI Андрей Карпатый считает, что создание полноценных ИИ-агентов займет около десяти лет из-за фундаментальных ограничений текущих технологий.
OpenAI переживает кризис: рост ChatGPT замедляется, GPT-5 обвиняют в преувеличении возможностей, а разрешение эротического контента вызывает споры о стратегии компании.
Google объединила Gemini CLI с GKE для автоматизации развертывания языковых моделей. Инструмент предоставляет рекомендации по оптимизации затрат и производительности LLM-рабочих нагрузок.