ИИ от KAUST учится переписывать собственный код
Исследователи из Университета науки и технологий имени короля Абдаллы представили систему Huxley-Gödel Machine — ИИ-агента, способного эволюционировать за счет самостоятельного переписывания и улучшения своего кода. Разработка частично реализует концепцию «Машины Гёделя», предложенную пионером ИИ Юргеном Шмидхубером.
Новый подход к эволюции искусственного интеллекта
В отличие от большинства современных подходов, ориентированных на краткосрочные метрики производительности, команда KAUST сфокусировалась на долгосрочной эволюционной продуктивности. Исследователи выявили проблему «несоответствия метапродуктивности и производительности»: агент, демонстрирующий высокие результаты в тестах, может порождать слабых потомков, тогда как менее эффективная версия способна эволюционировать в более продуктивную линию.
Для измерения этого динамического процесса ученые предложили новую метрику — Clade Metaproductivity (CMP), оценивающую коллективный выход всех потомков агента, а не его индивидуальную производительность.
Как работает самоулучшающийся ИИ
Huxley-Gödel Machine использует комбинацию древовидного поиска, байесовской выборки и адаптивного планирования для принятия решений о создании новых агентов и тестировании существующих. Система фокусируется на улучшении:
- Управляющей логики
- Использования инструментов
- Анализа ошибок
Агент переписывает Python-файлы, тестовые скрипты и инструменты, запускает эксперименты и перманентно принимает успешные варианты. Со временем это приводит к появлению версий, которые уточняют собственные архитектуры, стратегии и потоки управления.
Результаты, превосходящие человеческие системы
На бенчмарке SWE-Bench Verified, содержащем 500 реальных задач с GitHub, агент с моделью GPT-5-mini решил 61,4% задач — наивысший показатель для этого типа моделей. Он превзошел лучшие человеческие системы на официальной таблице лидеров и вошел в топ-10 общих систем, несмотря на использование менее мощных моделей по сравнению с конкурентами.
На тесте SWE-Bench Lite с GPT-5-mini агент показал 40% точности на непересекающихся задачах и 49% на всех задачах. С более крупной GPT-5 точность возросла до 48% и 57% соответственно, что примерно соответствует лучшим человеческим системам.
На бенчмарке Polyglot, охватывающем несколько языков программирования, HGM снова превзошел предыдущие подходы, используя при этом в 2-6 раз меньше вычислительных ресурсов.
Ирония в том, что самый впечатляющий прорыв в ИИ происходит не через создание всё более крупных моделей, а через обучение систем самостоятельно улучшать свою архитектуру. Это напоминает эволюцию в природе: выживают не самые сильные, а самые адаптивные. Правда, пока это больше похоже на лабораторный эксперимент, чем на реальную угрозу сингулярности — система всё ещё требует человеческого контроля и ограничена конкретными задачами.
Исследователи подчеркивают, что прорыв достигнут не за счет более мощной языковой модели, а через улучшение архитектуры агента посредством самонаправленной модификации. Это закладывает основу для адаптивных и ресурсоэффективных систем ИИ, которые могут непрерывно эволюционировать с минимальным человеческим вмешательством.
По материалам The Decoder.
