Месяц: Декабрь 2025

LLM

Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам
12 декабря, 2025

Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.

Читайте далее Бенчмарк FACTS показал, что ведущие LLM не набрали даже 70% точности по фактам
Разработка

Verbatim RAG: метод извлечения текста для полного устранения галлюцинаций в RAG-системах
10 декабря, 2025

Verbatim RAG устраняет галлюцинации в RAG-системах, заставляя модели извлекать точные фрагменты текста вместо генерации ответов.

Читайте далее Verbatim RAG: метод извлечения текста для полного устранения галлюцинаций в RAG-системах
Машинное обучение

Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей
10 декабря, 2025

Гибридный оптимизатор Muon+AdamW показал лучшие результаты при тонкой настройке языковых моделей, превзойдя как чистый Muon, так и AdamW в экспериментах с Qwen3 4B.

Читайте далее Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей
Разработка

RAG для потоковых данных: новый подход к работе с динамической информацией
10 декабря, 2025

Новый подход к RAG-архитектуре позволяет работать с потоковыми данными в реальном времени, решая проблему задержек традиционных систем при обработке динамической информации.

Читайте далее RAG для потоковых данных: новый подход к работе с динамической информацией
Машинное обучение

Amazon представляет Nova Lite 2.0 — систему рассуждений для сложных сценариев техподдержки
10 декабря, 2025

Amazon представила Nova Lite 2.0 — систему искусственного интеллекта для поддержки клиентов, которая использует архитектуру, основанную на рассуждениях, для решения сложных, многошаговых запросов.

Читайте далее Amazon представляет Nova Lite 2.0 — систему рассуждений для сложных сценариев техподдержки
Машинное обучение

Waymo раскрывает архитектуру безопасного ИИ для беспилотных автомобилей
10 декабря, 2025

Waymo раскрывает архитектуру своего ИИ для беспилотных автомобилей, основанную на принципе доказуемой безопасности и достигшей 100 миллионов миль автономного движения.

Читайте далее Waymo раскрывает архитектуру безопасного ИИ для беспилотных автомобилей
Безопасность

Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает
10 декабря, 2025

Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.

Читайте далее Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает
LLM

Исследование сотен миллионов чатов показало, что ИИ-агентов чаще используют для сложных задач
10 декабря, 2025

Первое масштабное исследование использования AI-агентов показало, что 57% активности приходится на когнитивную работу, а не рутинные задачи.

Читайте далее Исследование сотен миллионов чатов показало, что ИИ-агентов чаще используют для сложных задач
LLM

Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы
10 декабря, 2025

Jais 2 — семейство арабских языковых моделей от G42 и Cerebras, работающих со скоростью 2000 токенов/с и устанавливающих новые стандарты культурного соответствия.

Читайте далее Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы
LLM

Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией
10 декабря, 2025

Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.

Читайте далее Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией