Карпатый создал прототип оркестрации ИИ для совместного анализа

На выходных Андрей Карпатый, бывший директор по искусственному интеллекту в Tesla и сооснователь OpenAI, решил прочитать книгу — но не в одиночку. Он захотел сделать это в компании целого комитета искусственных интеллектов, где каждый модель предлагает свою точку зрения, критикует других и в итоге синтезирует финальный ответ под руководством «председателя».

Для реализации этой идеи Карпатый написал то, что назвал «проектом настроения» — программное обеспечение, созданное быстро, в основном с помощью ИИ-ассистентов, предназначенное скорее для развлечения, чем для практического применения. Он опубликовал результат, репозиторий под названием «LLM Council», на GitHub с категоричным предупреждением: «Я не собираюсь его как-либо поддерживать… Код теперь эфемерен, а библиотеки избыточны».

Как работает LLM Council: четыре модели ИИ спорят и синтезируют ответы

Для обычного наблюдателя веб-приложение LLM Council выглядит почти идентично ChatGPT. Пользователь вводит запрос в чат, но за кулисами приложение запускает сложный трехэтапный рабочий процесс, напоминающий работу человеческих совещательных органов.

Сначала система отправляет запрос пользователя группе передовых моделей. В конфигурации Карпатый по умолчанию это включает GPT-5.1 от OpenAI, Gemini 3.0 Pro от Google, Claude Sonnet 4.5 от Anthropic и Grok 4 от xAI. Эти модели генерируют свои первоначальные ответы параллельно.

На втором этапе программное обеспечение выполняет взаимную оценку. Каждой модели предоставляются анонимизированные ответы ее коллег, и ее просят оценить их на основе точности и глубины. Этот шаг превращает ИИ из генератора в критика, добавляя слой контроля качества, который редко встречается в стандартных чат-ботах.

Наконец, назначенный «председатель» — в настоящее время настроенный как Gemini 3 от Google — получает исходный запрос, индивидуальные ответы и оценки коллег. Он синтезирует всю эту массу контекста в единый авторитетный ответ для пользователя.

Карпатый отметил, что результаты часто оказываются неожиданными. «Довольно часто модели удивительно охотно выбирают ответ другого ИИ как превосходящий их собственный», — написал он в X (бывший Twitter). Он описал использование инструмента для чтения глав книг, отметив, что модели последовательно хвалили GPT-5.1 как наиболее проницательную, тогда как Claude получал самые низкие оценки.

Этот «проект настроения» демонстрирует фундаментальный сдвиг в разработке программного обеспечения — когда сложные архитектурные решения становятся настолько тривиальными, что их можно реализовать за выходные. Карпатый случайно создал то, за что корпорации платят миллионы: рабочую схему оркестрации мультимодельного ИИ.

FastAPI, OpenRouter и подход к моделям как к взаимозаменяемым компонентам

Для технических директоров и архитекторов платформ ценность LLM Council заключается не в литературной критике, а в его конструкции. Репозиторий служит основным документом, показывающим, как выглядит современный минималистичный стек ИИ в конце 2025 года.

Приложение построено на «тонкой» архитектуре. Бэкенд использует FastAPI, современный фреймворк на Python, в то время как фронтенд представляет собой стандартное приложение React, собранное с помощью Vite. Хранение данных обрабатывается не сложной базой данных, а простыми JSON-файлами, записываемыми на локальный диск.

Ключевым элементом всей операции является OpenRouter, агрегатор API, который нормализует различия между различными поставщиками моделей. Маршрутизируя запросы через этого единого брокера, Карпатый избежал написания отдельного кода интеграции для OpenAI, Google и Anthropic. Приложение не знает и не заботится о том, какая компания предоставляет интеллект; оно просто отправляет промпт и ожидает ответа.

Этот дизайнерский выбор подчеркивает растущую тенденцию в корпоративной архитектуре: коммодитизацию модельного уровня. Рассматривая передовые модели как взаимозаменяемые компоненты, которые можно заменить редактированием одной строки в файле конфигурации — конкретно списка COUNCIL_MODELS в бэкенд-коде — архитектура защищает приложение от привязки к поставщику.

Что отсутствует от прототипа до продакшена: аутентификация, обезличивание данных и соответствие

Хотя основная логика LLM Council элегантна, она также служит яркой иллюстрацией разрыва между «выходным хаком» и производственной системой. Для корпоративной команды платформы клонирование репозитория — это лишь первый шаг марафона.

Технический аудит кода выявляет отсутствующую «скучную» инфраструктуру, которую коммерческие поставщики продают по премиальным ценам. В системе отсутствует аутентификация; любой, имеющий доступ к веб-интерфейсу, может запрашивать модели. Нет концепции ролей пользователей, что означает, что младший разработчик имеет те же права доступа, что и технический директор.

Кроме того, уровень управления отсутствует. В корпоративной среде одновременная отправка данных четырем различным внешним поставщикам ИИ вызывает немедленные проблемы с соответствием требованиям. Здесь нет механизма для обезличивания персональных данных перед их отправкой из локальной сети, равно как и журнала аудита для отслеживания того, кто что спрашивал.

Надежность — еще один открытый вопрос. Система предполагает, что API OpenRouter всегда работает и что модели ответят своевременно. В ней отсутствуют схемы защиты, стратегии отката и логика повторных попыток, которые поддерживают работу бизнес-критичных приложений при сбое у поставщика.

Эти недостатки — не недостатки кода (Карпатый прямо заявил, что не собирается поддерживать или улучшать проект), но они определяют ценностное предложение для коммерческого рынка инфраструктуры ИИ.

Такие компании, как LangChain, AWS Bedrock и различные стартапы шлюзов ИИ, по сути продают «усиление» вокруг основной логики, продемонстрированной LLM Council. Они предоставляют обертки безопасности, наблюдаемости и соответствия, которые превращают сырой скрипт оркестрации в жизнеспособную корпоративную платформу.

Источник новости: VentureBeat

Андрей Карпатый создал прототип оркестрации ИИ для совместного анализа

Как работает LLM Council: четыре модели ИИ спорят и синтезируют ответы

FastAPI, OpenRouter и подход к моделям как к взаимозаменяемым компонентам

Что отсутствует от прототипа до продакшена: аутентификация, обезличивание данных и соответствие

10 локальных альтернатив ChatGPT для работы на вашем компьютере

PyTorch ускоряет вывод модели DRAMA в 2.3 раза с помощью NJT

Quora интегрировала 30 моделей Amazon Bedrock через унифицированный API-шлюз

Google расширяет функционал Gemini CLI для разработчиков бизнес-аналитики

Microsoft представила Promptions — фреймворк для точного управления ответами ИИ

Databricks создала клиентскую систему балансировки нагрузки для Kubernetes

Как работает LLM Council: четыре модели ИИ спорят и синтезируют ответы

FastAPI, OpenRouter и подход к моделям как к взаимозаменяемым компонентам

Что отсутствует от прототипа до продакшена: аутентификация, обезличивание данных и соответствие

Похожие записи