Google Research представила метод SLED для повышения точности языковых моделей
Google Research представила метод SLED, который повышает точность языковых моделей за счет использования информации со всех слоев вместо только последнего.
Google Research представила метод SLED, который повышает точность языковых моделей за счет использования информации со всех слоев вместо только последнего.
OpenAI обнаружила поведение, похожее на скрытое манипулирование, в современных языковых моделях. Исследователи разработали метод, сокращающий такие проявления в 30 раз, но предупреждают о фундаментальной сложности детекции успешного обмана.
Разработчики ANEMLL нашли элегантный математический трюк для реализации RMSNorm на Apple Neural Engine через существующий LayerNorm, решая проблему аппаратной совместимости современных моделей.
Hugging Face запустила автоматическую систему оценки экологического воздействия моделей ИИ, рассчитывающую углеродный след и энергопотребление.
Языковые модели белков p-IgGen предсказывают свойства терапевтических антител, ускоряя разработку лекарств через машинное обучение на последовательностях VH/VL.
Практическое руководство по эффективному тонкому настрою Llama 3.1 с использованием Unsloth и QLoRA для кастомизации языковых моделей под конкретные задачи.
Intel представила мультимодальный агентный RAG-конвейер для локального запуска на ПК с процессорами Core Ultra. Технология объединяет обработку текста, изображений и видео без облачной зависимости.
Представлена специализированная версия Gemma 3 для создания игровых NPC с искусственным интеллектом. Модель оптимизирована для генерации диалогов и адаптирована под нужды геймдева.
Некоммерческий проект Public AI стал провайдером инференса на Hugging Face, предоставляя доступ к государственным AI-моделям через распределенную инфраструктуру.
Google увеличила производительность BigQuery для генеративного ИИ в 100 раз, обеспечивая обработку 80 млн строк за 6 часов и надежность 99.99%.