Исследователи MIT создали симулятор эволюции зрения на основе ИИ-агентов
Группа исследователей из MIT разработала вычислительный фреймворк, который позволяет изучать эволюцию зрительных систем в виртуальной среде с использованием искусственного интеллекта. Этот инструмент, названный «научной песочницей», использует эволюционные алгоритмы и обучение с подкреплением для моделирования того, как различные задачи формируют архитектуру зрения у автономных агентов. Результаты работы опубликованы в журнале Science Advances.
Песочница для эволюционных экспериментов
Основная идея проекта — предоставить исследователям инструмент для тестирования гипотез о развитии зрения, что невозможно сделать в реальном мире. Учёные преобразовали все элементы камеры — сенсоры, линзы, апертуры и процессоры — в параметры, которые может изучать автономный ИИ-агент. Эти строительные блоки стали основой для алгоритмического механизма обучения, который агенты используют для эволюции «глаз» с течением времени.
Каждая среда в симуляции имеет одну конкретную задачу, например, навигацию, поиск пищи или распознавание объектов, имитируя реальные визуальные вызовы, с которыми сталкиваются животные. Агенты начинают с одного фоторецептора и связанной нейронной сети для обработки визуальной информации. Затем, в течение жизни каждого агента, он обучается методом проб и ошибок, получая вознаграждение за успешное выполнение задачи.
Это классический пример использования ИИ не для замены учёного, а для создания принципиально нового инструмента познания. Вместо того чтобы строить догадки о прошлом, мы можем запускать миллионы виртуальных эволюционных сценариев и наблюдать за результатами. Это меняет сам подход к фундаментальным биологическим вопросам.
Среда также включает ограничения, такие как определённое количество пикселей для визуальных сенсоров агента. Эти ограничения управляют процессом проектирования, подобно тому, как физические ограничения в нашем мире, например, законы оптики, повлияли на дизайн наших собственных глаз.
Как задачи формируют зрение
Исследователи обнаружили, что тип задачи оказывает решающее влияние на зрительные системы, которые эволюционируют у агентов. Например:
- Агенты, сфокусированные на задачах навигации, развивали глаза, предназначенные для максимизации пространственного восприятия через сенсоры низкого разрешения. Это часто приводило к эволюции составных глаз с множеством отдельных единиц, похожих на глаза насекомых.
- Агенты, задачей которых было различение объектов, с большей вероятностью эволюционировали в сторону камероподобных глаз с радужной оболочкой и сетчаткой, фокусируясь на фронтальной остроте зрения, а не на периферийном зрении.
Ещё один эксперимент показал, что больший «мозг» не всегда лучше, когда речь идёт об обработке визуальной информации. Из-за физических ограничений, таких как количество фоторецепторов, в систему может поступать только определённый объём визуальной информации за раз. В определённый момент больший мозг перестаёт помогать агентам, а в природе это было бы пустой тратой ресурсов.
От биологии к робототехнике
Практическая ценность этого фреймворка выходит за рамки фундаментальной науки. Он может направлять проектирование новых сенсоров и камер для роботов, дронов и носимых устройств, балансируя производительность с реальными ограничениями, такими как энергоэффективность и технологичность производства.
«Мы не можем вернуться назад и выяснить каждую деталь того, как происходила эволюция, но в этой работе мы создали среду, в которой можем, в некотором смысле, воссоздать эволюцию и исследовать её разными способами. Этот метод ведения науки открывает двери для множества возможностей», — говорит аспирант MIT Media Lab и соавтор исследования Кушгра Тивари.
По материалам MIT News.
