Cerebras представила технологию REAP для ускорения обучения языковых моделей
Cerebras представила технологию REAP, обещающую десятикратное ускорение обучения больших языковых моделей благодаря инновационной архитектуре и специализированным чипам.
Обзоры и новости программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей.
Cerebras представила технологию REAP, обещающую десятикратное ускорение обучения больших языковых моделей благодаря инновационной архитектуре и специализированным чипам.
Китай запускает первый коммерческий подводный дата-центр, Amazon планирует космические решения, а Европа сталкивается с водным кризисом на фоне роста AI-инфраструктуры.
Совместное тестирование Intel и Hugging Face показало 70% улучшение TCO для GPT OSS на новых процессорах Xeon 6 в Google Cloud C4.
Google представила открытую архитектуру Coral NPU для энергоэффективного ИИ на граничных устройствах с производительностью 512 GOPS при минимальном энергопотреблении.
Стартап Nscale подписал сделку с Microsoft на поставку 200 000 GPU Nvidia для ИИ-инфраструктуры в США и Европе, что знаменует один из крупнейших контрактов в индустрии.
Bharti Airtel и IBM объявили о стратегическом партнерстве для развития облачной платформы Airtel Cloud с акцентом на AI-инференс и гибридные решения для регулируемых отраслей.
Nvidia и Oracle расширяют партнерство для ускорения обработки данных в корпоративном ИИ. Интеграция платформ позволит предприятиям эффективнее обучать и развертывать модели искусственного интеллекта.
Oracle и Nvidia расширяют партнерство для создания суверенной ИИ-инфраструктуры в ОАЭ, что отражает растущий спрос на локальные ИИ-решения в регионе.
Nvidia представила мини-компьютер Jetson Orin Nano с AI-ускорителем для локального запуска языковых моделей. Устройство размером с кредитную карту предлагает 40 TOPS производительности.
Nvidia начинает продажи компактного AI-суперкомпьютера DGX Spark за $3999. Устройство помещается на столе и обеспечивает производительность дата-центра для работы с моделями до 200 млрд параметров.