Featured image for anthropic predstavila pyatoe pokolenie claude modeli fable 5 i mythos 5 no v urezannom vide

Anthropic представила пятое поколение Claude — модели Fable 5 и Mythos 5, но в урезанном виде

Компания Anthropic официально анонсировала выпуск двух новых моделей пятого поколения — Claude Fable 5 и Claude Mythos 5. Как сообщает The Decoder, новинки демонстрируют значительный отрыв от конкурентов в области разработки программного обеспечения и фундаментальных научных исследований.

В то время как Fable 5 предназначена для широкого круга задач и доступна через API, Mythos 5 остается специализированным инструментом. Эта модель ориентирована на кибербезопасность и биоинженерию, предоставляя доступ лишь ограниченному числу партнеров в рамках совместных проектов с правительством США. Оба решения базируются на одной архитектуре, но различаются настройками безопасности и сценариями применения.

Результаты бенчмарков выглядят впечатляюще: в тесте SWE-Bench Pro, имитирующем решение реальных задач из репозиториев GitHub, Fable 5 достигла показателя в 80,3%. Для сравнения, Claude Opus 4.8 набирает 69,2%, а GPT 5.5 останавливается на отметке 58,6%. Кажется, эпоха, когда ИИ лишь подсказывал синтаксис, окончательно уступает место автономному написанию сложных систем.

Прорыв в кодинге и аналитике данных

Практическое применение моделей уже подтверждают крупные игроки рынка. Платежный гигант Stripe сообщил, что использование Fable 5 позволило сжать пять месяцев инженерной работы до нескольких дней. Модель смогла за сутки завершить миграцию кодовой базы Ruby объемом 50 миллионов строк — задачу, которая обычно требует усилий целой команды в течение нескольких месяцев.

Визуальные возможности также вышли на новый уровень. Fable 5 способна воссоздать исходный код веб-приложения, основываясь исключительно на скриншотах, или извлекать точные данные из сложных научных иллюстраций. В качестве демонстрации автономности модель успешно прошла игру Pokemon FireRed, ориентируясь только по визуальному потоку, без использования внешних инструментов или карт.

В области финансовой аналитики модель показала лучшие результаты в тесте Hebbia, продемонстрировав рассуждения на уровне опытных специалистов. Торговая группа IMC подтвердила, что Fable 5 почти полностью справляется с их внутренними сценариями оценки рыночных данных, что ставит под вопрос необходимость участия человека в рутинной интерпретации отчетов.

Научная автономия и дизайн белков

Особого внимания заслуживает Mythos 5, работающая в области геномики и фармацевтики. По заявлениям Anthropic, модель в 10 раз ускорила процессы проектирования лекарственных препаратов. В ходе тестов ИИ самостоятельно выбирал участки связывания белков, запускал биоинформатические инструменты и исправлял возникающие ошибки без участия человека.

Любопытно, что в слепых тестах ученые Anthropic в 80% случаев отдавали предпочтение гипотезам в области молекулярной биологии, выдвинутым Mythos 5, а не предыдущими флагманскими моделями. Одна из таких гипотез, касающаяся белка E. coli, позже нашла подтверждение в независимом научном исследовании, что намекает на способность ИИ к реальному научному творчеству.

Пока Mythos 5 закрыта в «стеклянном вольере» регуляторов, обычным разработчикам предлагают оплачивать возросшие аппетиты Anthropic. В итоге мы получаем мощнейший инструмент, который рискует стать слишком дорогим для массовых экспериментов, оставаясь прерогативой тех, кто готов платить за автоматизацию целых отделов.

Экономика токенов и механизмы защиты

Ценовая политика Anthropic претерпела изменения: стоимость за миллион входных токенов установлена на уровне 10 долларов, что вдвое выше тарифов Opus 4.8. Выходные токены обойдутся в 50 долларов за миллион. На текущий момент Fable 5 доступна в рамках API и корпоративных планов, однако для обычных подписчиков Claude.ai доступ к ней вскоре станет лимитированным.

Для предотвращения опасного использования в Fable 5 внедрена система классификаторов. Если запрос касается кибератак или создания биологического оружия, система автоматически перенаправляет его на более слабую модель Opus 4.8. По данным компании, это затрагивает менее 5% сессий, но позволяет избежать прямой эксплуатации мощностей пятого поколения злоумышленниками.

Интересной деталью стала защита от дистилляции — попыток конкурентов обучить свои модели на ответах Claude. Anthropic применяет скрытые методы модификации промптов и векторы управления, чтобы снизить эффективность таких атак. Это подчеркивает обострение борьбы между западными лабораториями и азиатскими разработчиками в гонке за лидерство в сфере больших языковых моделей.

Похожие записи