Стартап Raindrop запускает первую платформу для A/B тестирования AI-агентов
Raindrop представила Experiments — первый A/B тестинг-сьют для оценки AI-агентов, позволяющий сравнивать производительность моделей и инструментов в реальных условиях.
Raindrop представила Experiments — первый A/B тестинг-сьют для оценки AI-агентов, позволяющий сравнивать производительность моделей и инструментов в реальных условиях.
Обзор проблемы определения AI-агентов и необходимости стандартизации уровней их автономии на основе опыта автомобильной, авиационной и робототехнической отраслей.
Hugging Face выпустила Mem-Agent — инструмент для создания ИИ-агентов с долговременной памятью, способных сохранять контекст между сессиями.
Исследование демонстрирует возможности ИИ-агентов в автоматизации data science: от классификации изображений до прогнозирования вулканических извержений.
Стартап Echelon вышел из скрытого режима с $4,75 млн финансирования, предлагая AI-агентов для автоматизации внедрения ServiceNow, что угрожает традиционным консалтинговым моделям Accenture и Deloitte.
Amazon внедряет агентный ИИ Nova Act в QuickSight для автоматического создания аналитических отчетов, что может сократить время подготовки данных на 80%.
Стартап AUI заявляет о создании модели Apollo-1, которая значительно повышает надежность AI-агентов в выполнении задач, достигая 92.5% успеха в тестах.
Исследователи выпустили TOUCAN — крупнейший открытый набор данных с 1,5 млн реальных взаимодействий для обучения AI-агентов работе с инструментами.
Otter.ai расширяет функционал от простой транскрибации встреч до корпоративной базы знаний с новыми инструментами интеграции и AI-поиском.
Notion полностью перестроил архитектуру своей платформы для поддержки агентного ИИ, отказавшись от устаревших prompt-ориентированных подходов в пользу автономных reasoning-моделей.