Эффективная точная настройка Llama 3.1 с использованием Unsloth: практическое руководство
Практическое руководство по эффективному тонкому настрою Llama 3.1 с использованием Unsloth и QLoRA для кастомизации языковых моделей под конкретные задачи.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Практическое руководство по эффективному тонкому настрою Llama 3.1 с использованием Unsloth и QLoRA для кастомизации языковых моделей под конкретные задачи.
Некоммерческий проект Public AI стал провайдером инференса на Hugging Face, предоставляя доступ к государственным AI-моделям через распределенную инфраструктуру.
Google увеличила производительность BigQuery для генеративного ИИ в 100 раз, обеспечивая обработку 80 млн строк за 6 часов и надежность 99.99%.
Тестирование OpenAI GPT-OSS моделей показало, что меньшая 20-миллиардная модель с низким уровнем мышления часто превосходит более крупные аналоги по соотношению цена/качество.
Hugging Face представила инструмент на базе Gradio для обнаружения водяных знаков в текстах, сгенерированных языковыми моделями.
Verisk интегрировала генеративный ИИ через Amazon Bedrock для автоматизации анализа страховых тарифов, сократив время обработки с часов до минут и высвободив 15% рабочего времени поддержки.
OpenAI рассматривает введение обязательной верификации по ID для взрослых пользователей ChatGPT в ответ на ужесточение регуляторных требований к возрастным ограничениям.
GPT-5 демонстрирует технические улучшения в скорости и надежности, но не оправдывает ожиданий революционного прорыва. Модель стала более предсказуемой, но потеряла креативность.
OpenAI опубликовала первое исследование использования ChatGPT на основе внутренних данных: 700 млн пользователей, рост личного использования и доминирование письменных задач.
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.