Alibaba представила самую мощную языковую модель Qwen3-Max с триллионом параметров
Alibaba выпустила Qwen3-Max — самую мощную языковую модель с триллионом параметров, специализирующуюся на разработке ПО и автоматизации.
Qwen — семейство LLM и мультимодальных моделей Alibaba Cloud. Подробная информация: цены, документация, бенчмарки и новости.
Alibaba выпустила Qwen3-Max — самую мощную языковую модель с триллионом параметров, специализирующуюся на разработке ПО и автоматизации.
Alibaba представила мультимодальную модель Qwen3-Omni, которая обрабатывает текст, изображения, аудио и видео в реальном времени, конкурируя с GPT-4o и Gemini.
Основатель Alibaba Джек Ма вернулся к активному управлению компанией после нескольких лет отсутствия. Он курирует AI-стратегию и агрессивную борьбу за рынок с бюджетом 50 млрд юаней.
Исследователи создали ИИ-агента с постоянной памятью на основе архитектуры Obsidian. Модель Qwen3-4B обучалась через RL для работы с файловой системой и сохранения данных между сессиями.
Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.
Компактные 17-68M параметровые модели TinyLettuce превосходят миллиардные LLM в обнаружении галлюцинаций, работая в реальном времени на CPU.
GPT Proto запустила доступный API для редактирования и генерации изображений на базе моделей Qwen от Alibaba Cloud. Стоимость всего $0.0203 за операцию.
Новый метод GEPA от исследователей из Berkeley, Stanford и Databricks предлагает в 35 раз более эффективную оптимизацию языковых моделей без дорогостоящего обучения с подкреплением.
Nvidia выпустила компактную языковую модель Nemotron-Nano-9B-V2 с переключаемой функцией логических рассуждений и гибридной архитектурой для эффективного развертывания.