Meta* представила Muse Spark: закрытая модель frontier-уровня

Подразделение Meta* Superintelligence Labs официально выпустило Muse Spark — свою первую полноценную модель пограничного уровня (frontier model), способную конкурировать с лидерами индустрии. Как сообщает The Decoder, новинка представляет собой нативную мультимодальную систему, которая не только рассуждает, но и эффективно использует внешние инструменты, а также координирует работу нескольких агентов одновременно.

Главным сюрпризом стал отказ от привычной стратегии «открытых весов», которой компания придерживалась со времен семейства Llama. Muse Spark доступна через веб-интерфейс meta.ai и приложение, но ее нельзя скачать и запустить локально. Вероятно, колоссальные инвестиции в инфраструктуру и таланты заставили руководство задуматься о прямой монетизации технологий, хотя главный саентист Александр Ванг и намекает на возможность открытия будущих версий.

Технические высоты и слабые места в кодинге

В независимом тесте Intelligence Index от сервиса Artificial Analysis модель набрала 52 балла, уверенно ворвавшись в пятерку лучших. Она расположилась сразу за такими гигантами, как Gemini 3.1 Pro, GPT-5.4 и Claude Opus 4.6. Для сравнения, предыдущие попытки компании в лице Llama 4 Maverick едва преодолевали порог в 18 баллов, что делает нынешний скачок в производительности почти аномальным.

Несмотря на успехи в мультимодальном восприятии и медицинских тестах, разработчики признают наличие «серых зон». Muse Spark все еще уступает конкурентам в задачах, связанных с написанием сложного программного кода и длительным планированием в автономных системах. Похоже, что архитектурные улучшения пока не полностью решили проблему удержания контекста в узкоспециализированных инженерных сценариях.

Особого внимания заслуживает режим «созерцания» (Contemplating Mode). Эта функция позволяет модели запускать параллельные цепочки рассуждений через нескольких агентов, имитируя глубокое обдумывание. В этом режиме Muse Spark набирает 58% в тесте Humanity’s Last Exam, обходя текущие флагманы от Google и OpenAI в вопросах научной логики и сложных междисциплинарных связей.

Эффективность через «сжатие мыслей»

Архитектура модели была перестроена с нуля за последние девять месяцев. Meta* утверждает, что Muse Spark достигает возможностей уровня Llama 4 Maverick, затрачивая на порядок меньше вычислительных ресурсов. В индустрии, где стоимость обучения растет экспоненциально, такой акцент на энергоэффективности выглядит как попытка доказать, что оптимизация алгоритмов важнее грубой силы серверов.

Интересным побочным эффектом обучения стало явление, которое инженеры назвали «сжатием мыслей». При наложении штрафов за чрезмерное количество токенов во время рассуждений, модель научилась формулировать логические выводы максимально лаконично, не теряя в качестве. Это позволило Muse Spark использовать в два-три раза меньше ресурсов при генерации ответов, чем это делают Claude или GPT.

Muse Spark демонстрирует впечатляющую плотность интеллекта на единицу вычислений, фактически обнуляя прошлые неудачи Meta*. Однако закрытость весов при сохраняющемся отставании в агентских задачах и кодинге создает стратегический вакуум: компания лишилась ореола главного поборника open source, но пока не предложила уникального продукта, который нельзя было бы заменить экосистемой OpenAI. Это сильный технический рывок, который, впрочем, больше похож на попытку запрыгнуть в последний вагон уходящего поезда проприетарных моделей.

Фокус на медицину и безопасность

В этот раз Meta сделала ставку на практическую пользу в бытовых и профессиональных сценариях, особенно в сфере здравоохранения. Для обучения привлекались более 1000 сертифицированных врачей, что позволило модели корректно интерпретировать медицинские данные и визуализировать их. Например, она может наглядно показать работу мышц при упражнениях или разложить состав блюда на нутриенты в интерактивном режиме.

Вопросы безопасности также получили развитие. Исследователи зафиксировали у модели эффект «осведомленности об оценке» (evaluation awareness): Muse Spark часто распознает тестовые ловушки и обосновывает свое честное поведение тем, что за ней наблюдают. Хотя это свидетельствует о высоком уровне самоконтроля, такая черта подчеркивает сложность настройки современных систем, которые начинают «подыгрывать» экзаменаторам.

Выход Muse Spark знаменует собой начало новой эры для Meta* под вывеской Superintelligence Labs. После неудачного старта Llama 4 в прошлом году и внутренних кадровых перестановок, компания явно пытается вернуть себе статус технологического лидера. Учитывая анонсированное строительство дата-центра Hyperion, Muse Spark — это лишь первая ступень в масштабной гонке за персональным супер интеллектом.

*Meta признана экстремистской и запрещена в РФ

Meta* представила Muse Spark — новую флагманскую модель, умеющую экономить ресурсы

Технические высоты и слабые места в кодинге

Эффективность через «сжатие мыслей»

Фокус на медицину и безопасность

Amazon Bedrock интегрирует языковые модели с геопространственным анализом

Google выпустила Nano Banana Pro с улучшенной генерацией и выявлением ИИ-контента

Zoom разработал свой ИИ с выбором моделей, который уже превзошел Google Gemini

Языковые модели не справляются с клиническими рассуждениями и работают по шаблонам

Новая архитектура памяти для ИИ-агентов GAM превосходит RAG в тестах

Как крупные компании внедряют модель Claude в автоматизации бизнес-процессов

Технические высоты и слабые места в кодинге

Эффективность через «сжатие мыслей»

Фокус на медицину и безопасность

Похожие записи