Кремниевая фотоника для ИИ-кластеров NVIDIA: революция в энергоэффективности сетей
По сообщению Lambda, современные ИИ-кластеры масштабируются до сотен тысяч GPU, что требует принципиально нового подхода к организации сетевой инфраструктуры. Традиционные решения с отдельными оптическими трансиверами становятся узким местом по энергопотреблению, надежности и производительности.
Масштабирование вычислительных сетей для ИИ
Обучение современных больших языковых моделей требует объединения от десятков тысяч до миллионов GPU в единые кластеры. Даже для инференса распределенная обработка на сотнях GPU показывает значительно более высокую производительность по сравнению с одиночными узлами.
Для Lambda проектирование сетевой инфраструктуры стало ключевым элементом архитектуры вычислений, а не просто вспомогательным слоем. Сетевые технологии должны успевать за ежегодными циклами обновления GPU.
Что такое совмещенная оптика
Традиционные сетевые коммутаторы с отдельными оптическими трансиверами используют длинные высокоскоростные электрические линии. Сигнал проходит от специализированной интегральной схемы коммутатора через печатную плату, коннекторы и в отдельный модуль трансивера, где преобразуется в оптический сигнал. Каждый такой переход вносит потери сигнала и требует дополнительных активных компонентов для компенсации.
Совмещенная оптика с кремниевой фотоникой упрощает путь данных, размещая оптические компоненты непосредственно рядом с чипом коммутатора. Это значительно сокращает длину линий, уменьшает количество соединений и устраняет множество активных компонентов.

Преимущества для ИИ-кластеров
NVIDIA Quantum-X Photonics InfiniBand и NVIDIA Spectrum-X Photonics Ethernet используют совмещенную оптику с интегрированной кремниевой фотоникой для создания самых современных сетевых решений для масштабной ИИ-инфраструктуры.
- Снижение энергопотребления: интеграция оптического движка непосредственно рядом с чипом коммутатора устраняет необходимость в трансиверах с активными компонентами. NVIDIA заявляет о 3.5-кратном улучшении энергоэффективности по сравнению с традиционными сетями.
- Повышенная надежность: меньше отдельных оптических модулей, которые являются одним из самых ненадежных компонентов кластера. По данным NVIDIA, устойчивость повышается в 10 раз, а время непрерывной работы ИИ-приложений увеличивается в 5 раз.
- Снижение задержки: размещение оптического преобразования рядом с чипом коммутатора минимизирует длину электрических линий.
- Быстрое развертывание: меньше отдельных компонентов и упрощенная оптическая кабельная система ускоряют развертывание крупномасштабных кластеров. NVIDIA сообщает о 1.3-кратном ускорении выхода в эксплуатацию.

Планы Lambda по внедрению
Lambda готовит следующее поколение GPU-кластеров с интеграцией сетей на основе совмещенной оптики с использованием коммутаторов NVIDIA Quantum-X Photonics InfiniBand и Spectrum-X Photonics Ethernet. Эти достижения в области коммутации на кремниевой фотонике критически важны для проектирования масштабных систем обучения и инференса.
Для кластеров NVIDIA GB300 NVL72 и NVIDIA Vera Rubin NVL144 компания внедряет сети на основе совмещенной оптики для обеспечения более высокой надежности и производительности для клиентов.
Использование сетей на основе совмещенной оптики как основного элемента вычислительной архитектуры позволяет Lambda обеспечить ключевые инфраструктурные преимущества:
- Высокопропускные и низколатентные соединения между GPU при масштабировании до 100k+ GPU
- Снижение сложности развертывания и обслуживания
- Улучшение энергоэффективности сетевого уровня, освобождающее больше мощности для GPU
Переход к совмещенной оптике — это не просто эволюция, а революция в архитектуре ИИ-кластеров. Пока все говорят о производительности чипов, настоящая битва за эффективность разворачивается на уровне межсоединений. Снижение энергопотребления сетей на 70% при одновременном росте надежности в 10 раз — это тот редкий случай, когда инженерное решение дает выигрыш по всем фронтам. Жаль только, что такие технологии остаются прерогативой гигантов — для средних компаний стоимость входа все еще запредельная.
По мере роста требований к масштабированию ИИ-вычислений сети на основе совмещенной оптики станут фундаментальным элементом инфраструктуры высокопроизводительных GPU-кластеров.
