OpenAI представила архитектуру OWL для браузера Atlas с ChatGPT
Компания OpenAI раскрыла технические детали создания браузера Atlas с интегрированным ChatGPT. Как сообщает OpenAI, ключевым элементом стало создание новой архитектуры OWL, которая отделяет Chromium от основного процесса приложения.
Новый подход к браузерной архитектуре
Разработчики столкнулись с необходимостью переосмыслить традиционную архитектуру браузера. Вместо стандартного использования Chromium как основы они создали OWL (OpenAI’s Web Layer) — слой интеграции, который запускает процесс браузера Chromium вне основного процесса приложения Atlas.

Это решение позволило решить несколько фундаментальных проблем:
- Мгновенный запуск: Chromium загружается асинхронно в фоне
- Изоляция от сбоев: при падении Chromium приложение Atlas продолжает работу
- Ускоренная разработка: большинству инженеров не требуется собирать Chromium локально
- Современный стек: Atlas построен почти полностью на SwiftUI и AppKit
Техническая реализация OWL
Архитектура разделена на два основных компонента: OWL Client (само приложение Atlas) и OWL Host (процесс браузера Chromium). Они взаимодействуют через IPC с использованием системы Mojo — собственного механизма передачи сообщений Chromium.
OWL предоставляет простой Swift API с несколькими ключевыми концепциями:
- Session: глобальная конфигурация и управление хостом
- Profile: управление состоянием браузера для конкретного профиля пользователя
- WebView: управление и встраивание отдельных веб-контентов
- WebContentRenderer: передача событий ввода в конвейер рендеринга Chromium
- LayerHost/Client: обмен информацией композиции между UI и Chromium
Рендеринг через границы процессов
Одной из самых сложных задач стала передача пикселей через границу процессов. WebView, которые разделяют взаимно исключительное пространство представления в клиентском приложении, переключаются в общем контейнере композиции. На стороне Chromium этот контейнер соответствует gfx::AcceleratedWidget, который в конечном счете поддерживается CALayer.
Особые случаи, такие как выпадающие списки <select> или выборщики цветов, которые Chromium рендерит в отдельных виджетах-всплывающих окнах, используют тот же подход.
Интересно наблюдать, как OpenAI решает классические проблемы браузеростроения на новом уровне. Отделение Chromium в отдельный процесс — технически элегантное решение, но главный вопрос в том, насколько такая архитектура масштабируется при реальных нагрузках и множестве одновременно открытых вкладок. Особенно учитывая амбициозные планы по агентным сценариям использования.
Преимущества для разработки
OWL значительно ускорил процесс разработки. Поскольку большинству инженеров команды не требуется регулярно собирать Chromium из исходного кода, разработка идет намного быстрее — даже новые члены команды могут объединять простые изменения в свой первый день.
Библиотека OWL поставляется внутри компании как предварительно собранный бинарный файл, поэтому сборка Atlas занимает минуты, а не часы. Это позволило OpenAI сохранить свою инженерную культуру: каждый новый инженер вносит и объединяет небольшое изменение в первый же день работы.
Техническое решение OWL демонстрирует, как можно переосмыслить устоявшиеся архитектурные подходы в браузеростроении. Вместо простой адаптации существующих решений OpenAI создала принципиально новую модель, которая открывает возможности для более сложных агентных сценариев использования ChatGPT в веб-браузере.
