Transformer

LLM

Cerebras создала новую архитектуру нейросетей, чтобы решить проблему памяти у LLM
16 декабря, 2025

Cerebras представила Implicit Chain Transformer — архитектуру, решающую проблему отсутствия памяти у языковых моделей. Новая модель передает «вектор намерения» между токенами, что позволяет эффективно поддерживать состояние в задачах вроде сложения по модулю и обхода графа.

Читайте далее Cerebras создала новую архитектуру нейросетей, чтобы решить проблему памяти у LLM
LLM

Гетерогенные особенности внимания в RoPE-моделях с длинным контекстом
18 ноября, 2025

Открытие гетерогенных особенностей в механизме внимания RoPE-моделей: разные измерения отвечают за различные аспекты обработки длинного контекста.

Читайте далее Гетерогенные особенности внимания в RoPE-моделях с длинным контекстом
Машинное обучение

NVIDIA представила ИИ-модель для поиска и удаления персональных данных
29 октября, 2025

NVIDIA представила модель Nemotron-PII для автоматического обнаружения и удаления персональных данных из обучающих наборов ИИ с точностью более 90%.

Читайте далее NVIDIA представила ИИ-модель для поиска и удаления персональных данных
Машинное обучение

Создатель трансформеров признался в усталости от собственного изобретения
24 октября, 2025

Ллион Джонс, соавтор архитектуры трансформеров, заявил о кризисе креативности в ИИ-исследованиях из-за чрезмерной концентрации на одном подходе.

Читайте далее Создатель трансформеров признался в усталости от собственного изобретения
Машинное обучение

Представлена новая архитектура Reactive Transformer для языковых моделей
9 октября, 2025

Новая архитектура Reactive Transformer предлагает динамическую адаптацию к контексту, потенциально улучшая эффективность языковых моделей при сохранении качества.

Читайте далее Представлена новая архитектура Reactive Transformer для языковых моделей
LLM

В ОАЭ выпустили компактную языковую модель с продвинутыми способностями к логическому мышлению
10 сентября, 2025

ОАЭ выпустили компактную языковую модель Jais-LM с продвинутыми способностями к логическому мышлению и поддержкой арабского языка.

Читайте далее В ОАЭ выпустили компактную языковую модель с продвинутыми способностями к логическому мышлению