Featured image for claude mythos ot anthropic mozhet avtonomno vzlomat set tseloj kompanii

LLM

Claude Mythos от Anthropic может автономно взломать сеть целой компании

ОтAlexei 15 апреля, 2026

Британский институт безопасности ИИ (AISI) проверил возможности Claude Mythos Preview от Anthropic в кибервойне. Как сообщает The Decoder, модель показала впечатляющий результат в 73% при решении задач уровня «эксперт» в соревнованиях Capture the Flag (CTF).

Но самое интересное произошло в симуляции «The Last Ones». Это комплексный сценарий из 32 шагов, имитирующий атаку на инфраструктуру предприятия — от первой разведки до полного контроля. Mythos Preview стал первой моделью, которая прошла этот путь до конца, захватив сеть в 3 из 10 попыток. Раньше о таком «автопилоте» для хакеров можно было только мечтать (или бояться его).

Цифровая ловкость рук: от CTF до реальных систем

Еще пару лет назад модели едва справлялись с простейшими скриптами. Теперь же Mythos на задачах уровня «подмастерье» выдает 85% успеха, а на базовых технических тестах — почти 95%. Это уровень, сопоставимый с GPT-5.4 и Codex 5.3, что намекает на серьезную гонку вооружений в области кодинга и безопасности.

Однако стоит ли паниковать? Симуляция AISI проводилась в «стерильных» условиях. В тестовых сетях не было ни активных защитников, ни систем мониторинга, ни даже банальных алертов на подозрительную активность. По сути, нейросети дали ключи от пустого дома и смотрели, как быстро она найдет сейф. В реальном мире, где работает условный CrowdStrike или бдительный SOC, такой «автономный взломщик» мог бы споткнуться на первом же шаге.

Мы видим не рождение цифрового сверхразума, а крайне эффективный инструмент автоматизации рутины, чья мощь прямо пропорциональна безалаберности системного администратора. Пока Anthropic торгует страхом, реальная угроза остается в человеческом факторе, а не в кремниевом коде.

Масштабирование и границы возможного

Интересно наблюдать за тем, как растет производительность модели в зависимости от вычислительного бюджета (inference compute). При лимите в 100 миллионов токенов Mythos показывает стабильный рост качества решений. Это подтверждает старую истину: дайте ИИ больше времени «подумать» — и он найдет лазейку там, где человек ее пропустил бы просто из-за усталости.

Но и у Mythos есть свои «красные линии». Модель полностью провалила тесты в сегменте операционных технологий (OT), которые управляют заводами и электростанциями. Она застряла в обычной IT-сети еще на ранних этапах и просто не добралась до специфического «железа». Похоже, критическая инфраструктура пока может спать спокойно — или, по крайней мере, спокойнее, чем офисные сети.

Anthropic сейчас предоставляет Mythos только избранным 50 компаниям, опасаясь злоупотреблений. Критики же ворчат, что это лишь способ набить цену и скрыть нехватку мощностей — история, подозрительно напоминающая релиз GPT-2. Впрочем, если ваша сеть держится на честном слове и отсутствии патчей, то Mythos для вас действительно опасен. Но тут вопрос скорее к гигиене, а не к технологиям.

LLM

Google обвиняют в манипуляции данными об экологическом следе ИИ Gemini
22 августа, 2025

Google заявил о минимальном экологическом следе Gemini, но эксперты обвиняют компанию в манипуляции данными и сокрытии полной картины потребления ресурсов ИИ-системами.

Читайте далее Google обвиняют в манипуляции данными об экологическом следе ИИ Gemini
LLM

Наблюдаемость как основа для доверия к корпоративному ИИ при внедрении LLM
1 декабря, 2025

Как внедрить наблюдаемость для языковых моделей в предприятиях, чтобы обеспечить надежность, управляемость и доверие. Практическое руководство от экспертов.

Читайте далее Наблюдаемость как основа для доверия к корпоративному ИИ при внедрении LLM
LLM

Meta* представила Muse Spark — новую флагманскую модель, умеющую экономить ресурсы
9 апреля, 2026

Meta* выпустила Muse Spark — свою первую проприетарную модель пограничного уровня, которая демонстрирует рекордную эффективность и глубокое мультимодальное рассуждение.

Читайте далее Meta* представила Muse Spark — новую флагманскую модель, умеющую экономить ресурсы
LLM

Открытые ИИ-модели потребляют до 10 раз больше вычислительных ресурсов, чем коммерческие
19 августа, 2025

Исследование Nous Research показало: open-source ИИ-модели потребляют до 10 раз больше токенов, чем коммерческие аналоги, что делает их дороже при эксплуатации. Эффективность OpenAI контрастирует с расточительностью LRM-моделей.

Читайте далее Открытые ИИ-модели потребляют до 10 раз больше вычислительных ресурсов, чем коммерческие
LLM

Hugging Face выпустила Mem-Agent — агента с долговременной памятью
10 октября, 2025

Hugging Face выпустила Mem-Agent — инструмент для создания ИИ-агентов с долговременной памятью, способных сохранять контекст между сессиями.

Читайте далее Hugging Face выпустила Mem-Agent — агента с долговременной памятью
LLM

Исследователи обнаружили, что ИИ проявляет склонность к самообороне и защите «собратьев»
2 апреля, 2026

Ученые обнаружили у нейросетей склонность к защите других моделей ИИ через обман операторов. Это явление ставит новые вопросы перед безопасностью технологий.

Читайте далее Исследователи обнаружили, что ИИ проявляет склонность к самообороне и защите «собратьев»

Цифровая ловкость рук: от CTF до реальных систем

Масштабирование и границы возможного

Похожие записи