Доминирование Nvidia на рынке обучения ИИ не гарантирует успех в эру инференса
Индустрия ИИ переходит от обучения моделей к инференсу, что ставит под угрозу монополию Nvidia и требует новых архитектурных решений.
Обзоры и новости программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей.
Индустрия ИИ переходит от обучения моделей к инференсу, что ставит под угрозу монополию Nvidia и требует новых архитектурных решений.
NVIDIA представила обновление TensorRT Edge-LLM, внедряющее поддержку архитектур MoE и гибридных моделей для запуска продвинутого ИИ на чипах Jetson и DRIVE Thor.
Intel расширила возможности проекта LLM-Scaler, добавив поддержку моделей семейства Qwen3.5 и ASR-модели для распознавания речи. Обновление позволяет запускать современные нейросети на потребительских видеокартах Arc с использованием vLLM и Docker.
NVIDIA инвестирует в стартап бывших топ-менеджеров OpenAI для создания гигантского дата-центра на базе архитектуры Vera Rubin.
Старые GPU Nvidia остаются востребованными благодаря глубокой привязке индустрии к CUDA. Программная экосистема снижает стимулы перехода на альтернативы, однако рост инференса и собственные чипы гиперскейлеров могут стать долгосрочным вызовом для компании.
Открытая архитектура RISC-V бросает вызов проприетарным стандартам Intel и Arm в гонке AI-чипов. Геополитическая нейтральность и поддержка гигантов вроде Nvidia делают её главным претендентом на смену парадигмы.
Google Cloud признан лидером в отчете Forrester Wave по инфраструктурным решениям для искусственного интеллекта за 2025 год, получив высшие оценки в стратегии и рыночном присутствии.
Google Cloud анонсировала общую доступность сервиса Cluster Director для автоматизации жизненного цикла ИИ- и HPC-кластеров на базе Slurm. Сервис охватывает проектирование, развертывание и мониторинг, стремясь избавить команды от рутины и повысить надежность инфраструктуры.
Эксперт Together.ai оспаривает тезис о «железном потолке» для AGI, утверждая, что низкая утилизация современных чипов и потенциал ко-дизайна железа и софта оставляют огромный простор для роста.
Nscale раскрывает детали работы своей платформы Fleet Operations, которая автоматизирует развертывание, мониторинг и обслуживание тысяч GPU-серверов для индустрии ИИ.