PyTorch

LLM

Представлена полнофункциональная языковая модель GuppyLM на 9 млн параметров и 130 строк кода
6 апреля, 2026

Проект компактной языковой модели на 9 миллионов параметров доказывает, что для понимания работы трансформеров не нужны миллиардные бюджеты.

Читайте далее Представлена полнофункциональная языковая модель GuppyLM на 9 млн параметров и 130 строк кода
Машинное обучение

Библиотека NeuralOperator теперь доступна в экосистеме PyTorch
15 декабря, 2025

Библиотека NeuralOperator, реализующая нейронные операторы для работы с дифференциальными уравнениями, официально вошла в экосистему PyTorch. Это делает передовые методы моделирования физических процессов доступными для широкого круга разработчиков.

Читайте далее Библиотека NeuralOperator теперь доступна в экосистеме PyTorch
Железо

AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan
4 декабря, 2025

AMD и Meta* достигли 96% эффективности масштабирования при обучении MoE-моделей на 1024 GPU с помощью TorchTitan и Primus-Turbo.

Читайте далее AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan
Разработка

PyTorch представляет OpenReg — симулятор акселераторов для тестирования аппаратного обеспечения
24 ноября, 2025

PyTorch выпустила OpenReg — симулятор акселераторов для тестирования пользовательского аппаратного обеспечения с использованием механизма PrivateUse1 DispatchKey.

Читайте далее PyTorch представляет OpenReg — симулятор акселераторов для тестирования аппаратного обеспечения
Машинное обучение

Как на практике используется алгоритм оптимизации Adam для обучения нейросетей
17 ноября, 2025

Глубокий анализ оптимизатора Adam — фундаментального алгоритма для обучения нейронных сетей, его технических особенностей и практического применения в современных ML-фреймворках.

Читайте далее Как на практике используется алгоритм оптимизации Adam для обучения нейросетей
LLM

PyTorch внедряет разреженный вывод для ускорения работы больших языковых моделей
14 ноября, 2025

PyTorch представляет фреймворк разреженного вывода для LLM, обещающий ускорение в 2-6 раз. Технология использует кэширование весов и новые методы порогового отсечения для современных моделей.

Читайте далее PyTorch внедряет разреженный вывод для ускорения работы больших языковых моделей
Разработка

Helion — высокоуровневый DSL для создания производительных и портируемых ядер ML
23 октября, 2025

PyTorch представил Helion — высокоуровневый DSL для создания оптимизированных ядер ML, который компилируется в код Triton и автоматически настраивает производительность для разных аппаратных архитектур.

Читайте далее Helion — высокоуровневый DSL для создания производительных и портируемых ядер ML
Разработка

PyTorch выпустила torchcomms — API для распределенных вычислений на сотни тысяч GPU
23 октября, 2025

PyTorch представил torchcomms — новый API для распределенных вычислений, способный масштабироваться на сотни тысяч GPU. Включает бэкенд NCCLX, уже используемый Meta для обучения Llama3 и Llama4.

Читайте далее PyTorch выпустила torchcomms — API для распределенных вычислений на сотни тысяч GPU
Разработка

PyTorch и Lightning AI объединяют усилия для упрощения распределенного обучения
23 октября, 2025

PyTorch и Lightning AI интегрируют фреймворк Monarch для упрощения распределенного обучения ML-моделей, предлагая интерактивную разработку прямо из блокнотов.

Читайте далее PyTorch и Lightning AI объединяют усилия для упрощения распределенного обучения
Разработка

Фреймворк Ray присоединяется к PyTorch Foundation для создания единого стека распределенных вычислений ИИ
23 октября, 2025

Распределенный фреймворк Ray официально присоединился к PyTorch Foundation, создавая единый стек технологий для масштабирования AI-приложений от обучения до инференса.

Читайте далее Фреймворк Ray присоединяется к PyTorch Foundation для создания единого стека распределенных вычислений ИИ