ИИ проваливает политические опросы, ошибаясь на 23 процентных пункта
Исследование показало, что имитирующие опросы ИИ ошибаются на 23%. Модели систематически искажают мнения меньшинств, но стартапы продолжают их использовать.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Исследование показало, что имитирующие опросы ИИ ошибаются на 23%. Модели систематически искажают мнения меньшинств, но стартапы продолжают их использовать.
Новый тест Spiral-Bench выявил радикальные различия в безопасности языковых моделей: от осторожного GPT-5 до рискованного Deepseek.
Amazon запустила Q Business — корпоративный ИИ-ассистент для анализа данных и автоматизации бизнес-процессов на платформе AWS.
Cohere выпустила Command A Reasoning — первую языковую модель с функцией логического вывода для корпоративных задач. Модель поддерживает 256k токенов и 23 языка.
Microsoft уточняет своё исследование о влиянии ИИ на профессии: полезность технологии не означает автоматического вытеснения рабочих мест. Анализ показывает ограничения методологии.
Google запускает глобальную экспансию AI Mode с функциями бронирования ресторанов и персонализацией для подписчиков Ultra-тарифа за $250 в месяц.
OpenAI ужесточила лимиты GPT-5: бесплатные пользователи ограничены 10 запросами каждые 5 часов. Сравнение с GPT-4 и возможности обхода ограничений.
Китайский стартап DeepSeek выпустил модель V3.1, которая конкурирует с GPT-5 по производительности, но предлагает более выгодные условия для разработчиков благодаря открытой архитектуре.
Инструкция по восстановлению доступа к ChatGPT-4 после автоматического обновления до GPT-5. Практические шаги и технические особенности разных версий модели.
Together AI запустила платформу для тонкой настройки языковых моделей под специфические домены, упрощая создание экспертных систем без сложной инфраструктуры.