AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan
AMD и Meta* достигли 96% эффективности масштабирования при обучении MoE-моделей на 1024 GPU с помощью TorchTitan и Primus-Turbo.
Обзоры и новости программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей.
AMD и Meta* достигли 96% эффективности масштабирования при обучении MoE-моделей на 1024 GPU с помощью TorchTitan и Primus-Turbo.
Дата-центры Amazon в Орегоне усугубляют загрязнение питьевой воды нитратами, что связывают с ростом заболеваемости раком и выкидышей среди местных жителей.
xAI Илона Маска строит солнечную электростанцию на 30 МВт рядом с дата-центром Colossus, но это покрывает лишь 10% его потребностей на фоне эксплуатации 400 МВт газовых турбин.
Технологические гиганты планируют удвоить энергопотребление ИИ к 2030 году, инвестируя 2,5 трлн долларов. Аналитики уверены, что энергосистема США справится с нагрузкой.
Nvidia публично отреагировала на сообщения о возможном переходе Meta на AI-чипы Google. Акции компании упали на 2,5%, тогда как Alphabet демонстрирует рост.
Huawei представила программную платформу FlexAI для повышения эффективности использования AI-процессоров Ascend через одновременный запуск нескольких фреймворков машинного обучения.
Магазины переходят на плавающее ценообразование для оперативной памяти из-за дефицита, вызванного спросом со стороны ИИ-индустрии.
Lambda внедряет кремниевую фотонику в ИИ-кластеры для снижения энергопотребления сетей на 70% и повышения надежности в 10 раз.
Google планирует увеличить вычислительные мощности для ИИ в 1000 раз за пять лет, удваивая серверные мощности каждые шесть месяцев для удовлетворения растущего спроса.
ScaleOps представила продукт для оптимизации GPU-инфраструктуры в корпоративных AI-развертываниях. Решение сокращает затраты на GPU на 50-70% и повышает эффективность использования ресурсов.