Математик с помощью GPT-5 решил задачу на оптимизацию, которую не могли решить 40 лет
Профессор Эрнест Рю из Калифорнийского университета в Лос-Анджелесе использовал языковую модель GPT-5 для решения математической проблемы, которая оставалась нерешенной на протяжении четырех десятилетий. Речь идет о фундаментальном вопросе в теории оптимизации, связанном с методом ускоренного градиента Нестерова.
Проблема и её значение
Метод ускоренного градиента Нестерова (NAG) был впервые представлен в 1983 году математиком Юрием Нестеровым и представляет собой оптимизационный метод, использующий форму предсказания — часто описываемую как «заглядывание вперед» — для ускорения сходимости алгоритмов.
Основная загадка заключалась в том, почему увеличение импульса алгоритма не влияет существенно на его стабильность. В обучении моделей машинного обучения или решении инженерных задач эффективность критически важна для избежания потерь вычислительных ресурсов и получения более быстрых результатов.
«Расширяя теоретический инструментарий в теории оптимизации, мы коллективно разрабатываем алгоритмы, оптимизированные для эффективности, стабильности и безопасности», — отметил Рю.
Исследование проблемы с GPT-5
Рю начал экспериментировать с GPT-5 после того, как услышал о его продвинутых возможностях в математике. Изначально он тестировал ChatGPT-3.5 еще в 2023 году, но тогда модель демонстрировала ограниченные способности в решении математических и логических задач.
«У него был интересный подход, о котором я не думал», — сказал профессор о GPT-5. Именно это побудило его продолжить исследование.
В процессе работы GPT-5 не изобретал новые математические инструменты и принципы, но оказался весьма эффективен в использовании существующих инструментов и нахождении уравнений, решений и идей из статей, немного выходящих за пределы данной области знаний.
«Он поразил меня странными вещами, которые пытался сделать. Его способность черпать из этого масштабного объема чтения и обучения — вот что делает его действительно мощным».
Ключевой прорыв
Переломный момент наступил, когда модель предложила способ переструктурирования уравнений, управляющих методом NAG. Предложение не было корректным в изначальной формулировке, но Рю распознал структурную особенность, которая казалась значимой, разработал ее более строго самостоятельно и начал задавать модели целевые вопросы для проверки жизнеспособности потенциального доказательства.
«Это было сюрреалистическое чувство», — поделился профессор, сравнив опыт с работой с компетентным студентом, который придумывает идеи, задает вопросы и проводит мозговой штурм.
Процесс занял около двенадцати часов за три дня сотрудничества с GPT-5. После почти дюжины подходов один из исследуемых методов наконец сработал.
Это классический пример того, как ИИ становится не заменой человеческого интеллекта, а его усилителем. GPT-5 здесь выступает в роли сверхбыстрого ассистента, способного перелопатить гигантские объемы математической литературы и предложить неочевидные связи. Правда, без экспертной проверки все эти «инсайты» так и остались бы просто красивыми гипотезами — что и демонстрирует важность симбиоза человека и машины в научных исследованиях.
Ограничения и возможности
Хотя процесс был значительно быстрее, он также требовал тщательной проверки. GPT-5 часто производил аргументы, которые выглядели правдоподобно, но не выдерживали проверки при детальном анализе.
Рю подчеркивает, что математическая интуиция человека остается критически важной: «То, как работает математическое исследование, заключается в том, что у вас есть идеи, и всякий раз, когда вы или ваши коллеги придумываете грубую идею, у вас есть ощущение, сработает она или нет. Вот где партнерство между искусственным интеллектом и людьми может работать особенно хорошо».
Этот случай демонстрирует потенциал больших языковых моделей как инструментов исследования, когда они объединяются с предметной экспертизой и тщательной проверкой.
По материалам OpenAI.
