Qwen

Qwen — семейство LLM и мультимодальных моделей Alibaba Cloud. Подробная информация: цены, документация, бенчмарки и новости.

Машинное обучение

Малые языковые модели превосходят GPT-4 в юридическом анализе благодаря методу Rubrics as Rewards
8 октября, 2025

Метод Rubrics as Rewards позволяет малым ИИ-моделям превосходить GPT-4 в специализированных задачах через структурированное обучение с детализированными критериями оценки.

Читайте далее Малые языковые модели превосходят GPT-4 в юридическом анализе благодаря методу Rubrics as Rewards
LLM

Intel ускоряет Qwen3-8B на Core Ultra с помощью обрезки слоев и спекулятивного декодирования
30 сентября, 2025

Intel и Hugging Face представили метод ускорения агентской модели Qwen3-8B на процессорах Core Ultra через спекулятивное декодирование и обрезку слоев, достигнув 1.4× прироста скорости.

Читайте далее Intel ускоряет Qwen3-8B на Core Ultra с помощью обрезки слоев и спекулятивного декодирования
Машинное обучение

RunwayML представила диффузионную модель A2D-VL для параллельной генерации текста на изображениях
25 сентября, 2025

RunwayML представила диффузионную модель A2D-VL, которая преобразует авторегрессионные модели в параллельные декодеры с гибким балансом скорости и качества генерации.

Читайте далее RunwayML представила диффузионную модель A2D-VL для параллельной генерации текста на изображениях
LLM

Alibaba представила самую мощную языковую модель Qwen3-Max с триллионом параметров
25 сентября, 2025

Alibaba выпустила Qwen3-Max — самую мощную языковую модель с триллионом параметров, специализирующуюся на разработке ПО и автоматизации.

Читайте далее Alibaba представила самую мощную языковую модель Qwen3-Max с триллионом параметров
LLM

Alibaba выпустила модель Qwen3-Omni для обработки текста, изображений, аудио и видео
24 сентября, 2025

Alibaba представила мультимодальную модель Qwen3-Omni, которая обрабатывает текст, изображения, аудио и видео в реальном времени, конкурируя с GPT-4o и Gemini.

Читайте далее Alibaba выпустила модель Qwen3-Omni для обработки текста, изображений, аудио и видео
Люди

Джек Ма вернулся в Alibaba с амбициозными планами по завоеванию рынка
16 сентября, 2025

Основатель Alibaba Джек Ма вернулся к активному управлению компанией после нескольких лет отсутствия. Он курирует AI-стратегию и агрессивную борьбу за рынок с бюджетом 50 млрд юаней.

Читайте далее Джек Ма вернулся в Alibaba с амбициозными планами по завоеванию рынка
LLM

Как работает ИИ-агент с постоянной памятью и онлайн-обучением с подкреплением
15 сентября, 2025

Исследователи создали ИИ-агента с постоянной памятью на основе архитектуры Obsidian. Модель Qwen3-4B обучалась через RL для работы с файловой системой и сохранения данных между сессиями.

Читайте далее Как работает ИИ-агент с постоянной памятью и онлайн-обучением с подкреплением
LLM

Together AI обновил сервис тонкой настройки больших языковых моделей
12 сентября, 2025

Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.

Читайте далее Together AI обновил сервис тонкой настройки больших языковых моделей
Машинное обучение

TinyLettuce: компактные модели для обнаружения галлюцинаций превосходят крупные языковые модели
2 сентября, 2025

Компактные 17-68M параметровые модели TinyLettuce превосходят миллиардные LLM в обнаружении галлюцинаций, работая в реальном времени на CPU.

Читайте далее TinyLettuce: компактные модели для обнаружения галлюцинаций превосходят крупные языковые модели
Разработка

GPT Proto запускает доступный API для редактирования изображений на базе Qwen
21 августа, 2025

GPT Proto запустила доступный API для редактирования и генерации изображений на базе моделей Qwen от Alibaba Cloud. Стоимость всего $0.0203 за операцию.

Читайте далее GPT Proto запускает доступный API для редактирования изображений на базе Qwen