LLaMA

Семейство открытых моделей Llama (3.x/4), распространяет веса и документацию на официальном портале Llama и поддерживает развёртывание через партнёров и собственные продукты

LLM

ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado
5 марта, 2026

Meta* готовит новое поколение ИИ-моделей под кодовыми именами Mango и Avocado. Они должны расширить возможности мультимодальности, рассуждения и стать основой стратегии персональных ИИ-ассистентов.

Читайте далее ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado
LLM

Llama.cpp представляет менеджер моделей с Hugging Face для локальной работы с ИИ
15 декабря, 2025

Llama.cpp представил встроенный менеджер моделей, который автоматизирует загрузку и управление ИИ-моделями из реестра GGML, упрощая локальную разработку и тестирование.

Читайте далее Llama.cpp представляет менеджер моделей с Hugging Face для локальной работы с ИИ
LLM

Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы
10 декабря, 2025

Jais 2 — семейство арабских языковых моделей от G42 и Cerebras, работающих со скоростью 2000 токенов/с и устанавливающих новые стандарты культурного соответствия.

Читайте далее Модель Jais 2 открывает эру арабских языковых моделей и обещает рекорды по скорости работы
Железо

NVIDIA доминирует в тестах MLPerf Training с архитектурой Blackwell Ultra
13 ноября, 2025

NVIDIA продемонстрировала абсолютное доминирование в тестах MLPerf Training v5.1, установив рекорды во всех семи категориях с архитектурой Blackwell Ultra и впервые использовав вычисления FP4.

Читайте далее NVIDIA доминирует в тестах MLPerf Training с архитектурой Blackwell Ultra
LLM

KT представила корейские языковые модели SOTA K и Mideum для локального ИИ
30 октября, 2025

KT представила три корейские языковые модели: SOTA K на базе GPT-4o, собственную Mideum и адаптированную Llama K для локального ИИ-рынка.

Читайте далее KT представила корейские языковые модели SOTA K и Mideum для локального ИИ
LLM

NVIDIA выпускает Nemotron-8B-Embed модель для генерации векторных представлений
22 октября, 2025

NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.

Читайте далее NVIDIA выпускает Nemotron-8B-Embed модель для генерации векторных представлений
LLM

Какие провальные запуски ИИ-проектов в 2025 году запомнились больше всего
16 октября, 2025

Обзор самых разочаровывающих запусков ИИ в 2025 году: от GPT-5 до Meta* Vibes. Почему обещания не совпали с реальностью и что пошло не так у лидеров индустрии.

Читайте далее Какие провальные запуски ИИ-проектов в 2025 году запомнились больше всего
Железо

SuperOffload ускоряет обучение больших языковых моделей на суперчипах NVIDIA
10 октября, 2025

Новая технология SuperOffload позволяет проводить тонкую настройку LLM до 70B параметров на суперчипах NVIDIA GH200 с ускорением до 4 раз и производительностью 600 TFLOPS.

Читайте далее SuperOffload ускоряет обучение больших языковых моделей на суперчипах NVIDIA
LLM

Эффективная точная настройка Llama 3.1 с использованием Unsloth: практическое руководство
18 сентября, 2025

Практическое руководство по эффективному тонкому настрою Llama 3.1 с использованием Unsloth и QLoRA для кастомизации языковых моделей под конкретные задачи.

Читайте далее Эффективная точная настройка Llama 3.1 с использованием Unsloth: практическое руководство
LLM

Google Research представила гибридный метод для ускорения работы языковых моделей
12 сентября, 2025

Google Research разработала гибридный метод, сочетающий каскады и спекулятивное декодирование для ускорения работы языковых моделей без потери качества генерации.

Читайте далее Google Research представила гибридный метод для ускорения работы языковых моделей