Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B
Архитектура Olmo Hybrid демонстрирует двукратный прирост эффективности обучения, однако проблемы с открытым ПО и инференсом мешают массовому внедрению технологии.
Архитектура Olmo Hybrid демонстрирует двукратный прирост эффективности обучения, однако проблемы с открытым ПО и инференсом мешают массовому внедрению технологии.
NVIDIA анонсировала Nemotron 3 Nano — компактную языковую модель с гибридной архитектурой Mamba-Transformer MoE и контекстом в 1 млн токенов, предназначенную для создания эффективных ИИ-агентов.
NVIDIA представила открытую экосистему Nemotron с моделями, данными и рецептами обучения для создания кастомных AI-систем любого масштаба.
Nvidia выпустила компактную языковую модель Nemotron-Nano-9B-V2 с переключаемой функцией логических рассуждений и гибридной архитектурой для эффективного развертывания.