DeepSeek разработал OCR-систему для сжатия текста из изображений
Китайская компания DeepSeek разработала систему OCR, которая сжимает текст из изображений в 10 раз, позволяя ИИ обрабатывать больше документов без перегрузки памяти.
Новые алгоритмы, исследования от ведущих лабораторий. Практические применения машинного обучения в бизнесе, науке и повседневной жизни.
Китайская компания DeepSeek разработала систему OCR, которая сжимает текст из изображений в 10 раз, позволяя ИИ обрабатывать больше документов без перегрузки памяти.
Hugging Face представила MTEB-v2 — расширенный бенчмарк для оценки моделей эмбеддингов с 113 датасетами и поддержкой 112 языков.
Amazon Science представила Chronos-2 — универсальную модель прогнозирования временных рядов, использующую обучение в контексте для работы с многомерными данными без переобучения.
NVIDIA представляет ML-IAP-Kokkos интерфейс для интеграции PyTorch-моделей с пакетом молекулярной динамики LAMMPS, обеспечивая масштабируемые симуляции на GPU.
Спутники и искусственный интеллект революционизируют мониторинг дикой природы в Африке, обеспечивая точность подсчета животных до 96,6%.
Google разработал метод генерации синтетических фотоальбомов с дифференциальной приватностью, используя промежуточное текстовое представление и иерархическую генерацию для сохранения тематической согласованности.
Splash Music использует AWS Trainium и SageMaker HyperPod для создания музыкальной модели HummingLM, преобразующей напевание в студийные треки.
Google разработала систему машинного обучения для оптимизации размещения виртуальных машин в облачных дата-центрах, использующую непрерывное прогнозирование времени жизни VM.
Principal Financial Group автоматизировала разработку чат-ботов на Amazon Lex v2, сократив время создания на 80% и стандартизировав процессы развертывания.
Представлен MLEB — самый масштабный бенчмарк для юридических эмбеддингов с 10 наборами данных из разных юрисдикций и типов документов.