TinyLettuce: компактные модели для обнаружения галлюцинаций превосходят крупные языковые модели
Компактные 17-68M параметровые модели TinyLettuce превосходят миллиардные LLM в обнаружении галлюцинаций, работая в реальном времени на CPU.
Новые алгоритмы, исследования от ведущих лабораторий. Практические применения машинного обучения в бизнесе, науке и повседневной жизни.
Компактные 17-68M параметровые модели TinyLettuce превосходят миллиардные LLM в обнаружении галлюцинаций, работая в реальном времени на CPU.
Sakana AI разработала эволюционный алгоритм M2N2 для объединения ИИ-моделей без дорогостоящего переобучения, создавая гибридные системы с новыми возможностями.
Андрей Карпати критикует обучение с подкреплением для LLM, предлагая интерактивные среды и системное промпт-обучение как альтернативные парадигмы для следующего прорыва в ИИ.
Представлен первый набор моделей для обнаружения галлюцинаций в турецком языке для RAG-систем, включающий три архитектуры и переведенный датасет.
AWS анонсировала автоматическое масштабирование для SageMaker HyperPod на базе Karpenter, что позволяет динамически управлять GPU-ресурсами для ML-процессов без операционных затрат.
Model2Vec позволяет создавать сверхбыстрые статические эмбеддинги из Sentence Transformers с ускорением в 500 раз и уменьшением размера в 15 раз без потери качества.
NVIDIA разработала метод тонкой настройки GPT-OSS с обучением с учетом квантизации, позволяющий сохранить преимущества 4-битного формата при восстановлении точности для специализированных задач.
NVIDIA разработала модель Cosmos Reason, которая учит ИИ физическому здравому смыслу через обучение с подкреплением. Модель возглавила лидерборд на Hugging Face.
Исследование MIT показывает, что простые физические модели часто точнее сложных нейросетей в климатических прогнозах, особенно для температурных режимов.
BonV Aero разрабатывает ИИ-дроны для автономной работы в сложных условиях, включая оборону и гражданские сектора, с продвинутой навигацией и устойчивостью к помехам.