Почему бессмысленно спрашивать у чат-бота о его ошибках
Исследование показывает: запросы к ИИ об их ошибках приводят к ложным ответам. Почему чат-боты не способны к интроспекции и как это влияет на их применение в разработке.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Исследование показывает: запросы к ИИ об их ошибках приводят к ложным ответам. Почему чат-боты не способны к интроспекции и как это влияет на их применение в разработке.
xAI открыл бесплатный доступ к Grok 4, спровоцировав гнев платных подписчиков. Ограничение в 5 запросов/12 часов и сравнение с ChatGPT 5 в разгаре «бесплатной войны» ИИ.
AI-стартап Perplexity предложил $34,5 млрд за браузер Google Chrome. Эксперты называют это пиар-ходом, учитывая десятикратную недооценку актива и отсутствие планов продажи у Google.
OpenAI вернула сложный выбор моделей в ChatGPT после неудачной попытки заменить его единым GPT-5. Пользователи восстали против удаления старых ИИ-моделей, вынудив Альтмана признать ошибку.
OpenAI анонсировала изменения в GPT-5: новые режимы работы, увеличенные лимиты сообщений и обновлённую «личность» модели. Реакция на пользовательскую критику.
Тестирование NVIDIA Nemotron Super 49B 1.5 показало: меньший размер не мешает лидировать в финансовой аналитике. Ключ к успеху — гибридные workflow и мультикритериальная оптимизация через syftr.
Руководитель ChatGPT Ник Тёрли рассказал о неожиданной привязанности пользователей к ИИ-моделям, изменениях в стратегии OpenAI и будущем платформы после запуска GPT-5.
OpenAI вернула доступ к GPT-4o для подписчиков Plus после массовых жалоб на принудительный переход к GPT-5. Пользователи выразили эмоциональную привязанность к предыдущей модели, а Альтман объяснил проблемы техническим сбоем.
OpenAI представила GPT-5 с улучшенной точностью и две open-source модели для локального запуска. Эксперты видят в этом тактический ход на фоне растущей конкуренции.
Исследователи Nvidia доказывают: малые языковые модели (SLM) эффективнее гигантских LLM для агентных систем. Экономия до 30 раз, локальный запуск и экология.