Model2Vec: дистилляция быстрых статических эмбеддингов из Sentence Transformers
Model2Vec позволяет создавать сверхбыстрые статические эмбеддинги из Sentence Transformers с ускорением в 500 раз и уменьшением размера в 15 раз без потери качества.
Новые алгоритмы, исследования от ведущих лабораторий. Практические применения машинного обучения в бизнесе, науке и повседневной жизни.
Model2Vec позволяет создавать сверхбыстрые статические эмбеддинги из Sentence Transformers с ускорением в 500 раз и уменьшением размера в 15 раз без потери качества.
NVIDIA разработала метод тонкой настройки GPT-OSS с обучением с учетом квантизации, позволяющий сохранить преимущества 4-битного формата при восстановлении точности для специализированных задач.
NVIDIA разработала модель Cosmos Reason, которая учит ИИ физическому здравому смыслу через обучение с подкреплением. Модель возглавила лидерборд на Hugging Face.
Исследование MIT показывает, что простые физические модели часто точнее сложных нейросетей в климатических прогнозах, особенно для температурных режимов.
BonV Aero разрабатывает ИИ-дроны для автономной работы в сложных условиях, включая оборону и гражданские сектора, с продвинутой навигацией и устойчивостью к помехам.
Подробный разбор методов квантования GPTQ и bitsandbytes для уменьшения размера моделей глубокого обучения с практическими примерами реализации.
AWS представила решение для интеллектуальной обработки документов на основе генеративного ИИ, сочетающее компьютерное зрение и языковые модели.
Databricks объявляет о приобретении Tecton для усиления возможностей реального времени в AI-приложениях. Сделка ускорит разработку персонализированных агентов.
YouTube использует дистилляцию знаний для запуска генеративных AI-эффектов на мобильных устройствах в реальном времени, преодолевая вычислительные ограничения.
AWS анонсировала Code Editor и множественные пространства в SageMaker Unified Studio для ускорения ML-разработки с привычным интерфейсом VS Code.