Исследование показало, что ИИ-модели могут обучаться на научных статьях, отозванных из-за ошибок
Исследование показало, что языковые модели обучаются на отозванных научных статьях, что угрожает достоверности генерируемой информации.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Исследование показало, что языковые модели обучаются на отозванных научных статьях, что угрожает достоверности генерируемой информации.
Исследование показывает, что ИИ-чаты проваливаются в понимании персидского культурного кода таароф, демонстрируя лишь 34-42% точности против 82% у носителей языка.
NVIDIA выпустила первый открытый синтетический датасет с 6 млн японских персонажей для обучения ИИ культурным особенностям Японии без использования персональных данных.
xAI выпустила Grok 4 Fast — модель ИИ с производительностью уровня Gemini 2.5 Pro, но стоимостью в 25 раз ниже. Контекстное окно 2 млн токенов и скорость 344 токена/сек.
DeepSeek представила V3.1-Terminus — улучшенную гибридную модель ИИ с фокусом на инструментальных задачах. Модель показывает рост производительности до 38.5 баллов в бенчмарках при сохранении агрессивных цен от $1.68 за миллион токенов.
ChatGPT с заявленным интеллектом уровня PhD демонстрирует системные сбои при ответах на простые вопросы про буквы алфавита, выявляя фундаментальные ограничения архитектуры GPT-5.
OpenAI интегрирует GPT-5 в корейский мессенджер KakaoTalk с октября 2025 года. Партнерство позволит 50 млн пользователей получить доступ к последней языковой модели без отдельного приложения.
Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.
Годовое исследование AAAS показало, что ChatGPT плохо справляется с суммаризацией научных статей, жертвуя точностью ради простоты и требуя такой же проверки фактов, как ручное написание.
Сравнение Perplexity и ChatGPT в 2025 году: скорость, точность и творческий потенциал двух ведущих языковых моделей с экспертным анализом сильных сторон каждой платформы.