Новые результаты бенчмарка Gaia2: почему важно явное мышление для ИИ-агентов
Обновление бенчмарка Gaia2 показывает: явное мышление улучшает агентские способности ИИ, но закрытые модели доминируют в поисковых задачах, а экономика токенов преподносит сюрпризы.
