Ученые бьют тревогу: развитие ИИ, возможно, достигло плато
Эксперты констатируют замедление прогресса ИИ: GPT-5 не оправдал ожиданий, подход «больше данных — больше вычислений» исчерпан. Падение акций CoreWeave сигнализирует о разочаровании рынка.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Эксперты констатируют замедление прогресса ИИ: GPT-5 не оправдал ожиданий, подход «больше данных — больше вычислений» исчерпан. Падение акций CoreWeave сигнализирует о разочаровании рынка.
OpenAI ввела лимиты на GPT-4 для ChatGPT Team: 100 сообщений каждые 3 часа. Как это повлияет на рабочие процессы команд и какие альтернативы стоит рассмотреть.
Исследователи считают, что GPT-5 не лишен эмпатии — проблема в отсутствии корректных метрик для её оценки. Новые бенчмарки могут изменить подход к разработке ИИ.
G42 запустила глобальный доступ к OpenAI GPT через свою облачную платформу Core42, предлагая альтернативу для рынков с ограниченным доступом к западным ИИ-сервисам.
Анализ GPT-5: архитектурные изменения и ограничения контекста продиктованы экономией. Реакция пользователей на удаление GPT-4o и тактика Алтмана.
Scale AI использует reinforcement learning для адаптации языковых моделей под корпоративные данные. Эксперты отмечают технологические сложности внедрения.
OpenAI добавила в ChatGPT переключатель режимов Auto, Fast и Thinking для GPT-5. Пользователи теперь могут гибко управлять балансом скорости и качества ответов.
OpenAI изменит политику вывода моделей из эксплуатации после скандала с GPT-5. Теперь компания будет предупреждать за 30 дней и сохранять API-доступ к старым версиям ещё 90 дней.
Hugging Face представил FilBench — первый бенчмарк для оценки LLM на филиппинских языках. Тестирование 41 модели выявило лидеров и слабые места, особенно в генерации текста.
Новый бенчмарк TextQuests на классических текстовых играх вскрыл слабости LLM в долгосрочном планировании и пространственном мышлении. Модели галлюцинируют в длинных сессиях и неэффективно тратят вычислительные ресурсы.