NVIDIA представляет интерфейс для подключения моделей PyTorch к молекулярным симуляциям
NVIDIA представляет ML-IAP-Kokkos интерфейс для интеграции PyTorch-моделей с пакетом молекулярной динамики LAMMPS, обеспечивая масштабируемые симуляции на GPU.
NVIDIA представляет ML-IAP-Kokkos интерфейс для интеграции PyTorch-моделей с пакетом молекулярной динамики LAMMPS, обеспечивая масштабируемые симуляции на GPU.
NVIDIA интегрировала Python в платформу CUDA, усиливая экосистему PyTorch. PyTorch скачивается более 2 млн раз в день, а компания предоставляет 1000+ открытых инструментов для разработчиков ИИ.
Новая технология SuperOffload позволяет проводить тонкую настройку LLM до 70B параметров на суперчипах NVIDIA GH200 с ускорением до 4 раз и производительностью 600 TFLOPS.
PyTorch выпустил предварительно квантованные версии популярных языковых моделей с рецептами оптимизации для серверных GPU и мобильных устройств.
Практическое руководство по миграции с PyTorch на JAX для GPU-ускоренного машинного обучения: сравнение фреймворков, оптимизации памяти и стратегии масштабирования.
Meta* делится методами сокращения времени компиляции PyTorch 2.0 для крупных моделей рекомендательных систем, где компиляция могла занимать более часа.
PyTorch 2.8 представляет нативную поддержку высокопроизводительного квантованного вывода LLM на CPU Intel, конкурируя с vLLM без сторонних фреймворков.
Hugging Face анонсировал ZeroGPU — технологию для эффективного использования графических процессоров в машинном обучении, что может снизить costs вычислений.
PyTorch представил Nested Jagged Tensors, ускоряющие вывод модели DRAMA в 2.3 раза за счет исключения вычислений на pad-токенах.
DeepSpeed ZenFlow решает проблему простоя GPU при оффлоадинге, обеспечивая до 5x ускорение обучения больших языковых моделей без потери точности.