Исследование выявило 3 ошибки в логике, из-за которых ИИ спотыкается даже на простых задачах
Исследование ARC-AGI-3 показало, что даже передовые модели вроде GPT-5.5 совершают критические ошибки в логике, не дотягивая до 1% успеха.
Исследование ARC-AGI-3 показало, что даже передовые модели вроде GPT-5.5 совершают критические ошибки в логике, не дотягивая до 1% успеха.
Исследователи MIT нашли механистическое объяснение законам масштабирования ИИ, связав их с геометрическим феноменом суперпозиции векторов.
Оксфордский стартап Lumai представил семейство оптических серверов Iris, которые используют свет для ускорения работы больших языковых моделей с экономией энергии до 90%.
Почти половина соискателей в Великобритании сталкивается с ИИ-интервью, но многие находят этот процесс унизительным и неестественным.
Компания Anthropic представила BioMysteryBench — тест для ИИ на основе реальных биологических данных. Модель Claude показала точность выше 80% на задачах экспертного уровня.
Alphabet отчиталась о рекордной выручке и планах на масштабные инвестиции в ИИ-инфраструктуру до 2026 года, несмотря на дефицит чипов и вопросы к прозрачности доходов.
Компания Tencent представила компактную нейросеть Hy-MT1.5-1.8B, которая обеспечивает качественный перевод на 33 языках полностью в офлайн-режиме.
Глава OpenAI Сэм Альтман анонсировал запуск GPT-5.5 Cyber, специализированной модели для экспертов по кибербезопасности, ориентированной на защиту критической инфраструктуры.
Apple представила фреймворк LaDiR, который позволяет языковым моделям проверять несколько вариантов решения задачи параллельно перед выдачей ответа.
Исследования подтверждают, что обучение больших языковых моделей на собственных данных ведет к статистической сингулярности и потере связи с реальностью.