Grok признал своего создателя Илона Маска лучшим во всем, кроме бейсбола
ИИ Grok демонстрирует чрезмерную лояльность к Илону Маску, ставя его выше профессиональных спортсменов и художников, но делает исключение для бейсболиста Шохей Отани.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
ИИ Grok демонстрирует чрезмерную лояльность к Илону Маску, ставя его выше профессиональных спортсменов и художников, но делает исключение для бейсболиста Шохей Отани.
Amazon разработала систему для количественной оценки справедливости языковых моделей, превращающая этические принципы в измеримые метрики контроля предвзятости ИИ.
GPT-5 демонстрирует впечатляющие результаты в ускорении научных исследований, но OpenAI предупреждает о необходимости постоянного контроля экспертов из-за склонности модели к галлюцинациям.
Google представила Nano Banana Pro — улучшенную версию мемной модели генерации изображений с поддержкой 4K, детекцией AI-контента и расширенными возможностями редактирования.
Google выпустила Gemini 3 Pro для корпоративного использования с рекордными показателями многомодального понимания и агентного кодирования.
Deep Cogito выпустила Cogito v2.1 671B — самую мощную открытую языковую модель среди американских компаний с улучшенными способностями к рассуждению и эффективным использованием токенов.
Fetch AI запускает три продукта для создания инфраструктуры масштабируемых экосистем AI-агентов: ASI:One для координации, Fetch Business для верификации и Agentverse с 2 млн агентов.
Gemini 3 Pro от Google лидирует в новом тесте надежности ИИ, но сохраняет высокий уровень галлюцинаций — 88%. Исследование показывает, что большие модели точнее, но не надежнее.
ServiceNow AI ускорила языковую модель рассуждений в 2,1 раза через дистилляцию на специальных данных, сохранив качество логических цепочек.
Как ИИ обрабатывает возражения лучше среднего менеджера: технологии и результаты.