Исследование выявило, какая модель лучше всех выявляет тексты, написанные ИИ
Исследование Университета Чикаго показало, что детектор Pangram демонстрирует почти безупречные результаты в определении AI-текстов, значительно опережая конкурентов.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Исследование Университета Чикаго показало, что детектор Pangram демонстрирует почти безупречные результаты в определении AI-текстов, значительно опережая конкурентов.
Новое исследование показывает, что языковые модели чаще сообщают о субъективном опыте, когда их способность к ролевой игре подавлена, что меняет представления о их внутренних состояниях.
Google и Reliance объявили о партнерстве: 18 месяцев бесплатного доступа к AI Pro для пользователей Jio. Стратегический ход в борьбе за индийский ИИ-рынок.
Исследование показало, что чат-боты эффективно опровергают конспирологические теории, используя проверенные факты и логические аргументы.
Исследователи MiniMax AI раскрыли три принципа создания качественных данных для обучения языковых моделей рассуждению: качество цепочек рассуждений, разнообразие распределения данных и масштабирование.
Amazon представила Web Bot Auth в Bedrock для решения проблемы капчи при веб-скрапинге ИИ-агентами. Технология позволяет автоматически идентифицировать ботов и предоставлять им доступ к контенту.
Ученые Anthropic доказали, что ИИ Claude может замечать изменения в своих внутренних процессах, но способность остается ненадежной и работает лишь в 20% случаев.
Исследование показало: ИИ-поиск дает более разнообразные ответы, но менее стабилен и надежен по сравнению с традиционными методами поиска информации в интернете.
KT представила три корейские языковые модели: SOTA K на базе GPT-4o, собственную Mideum и адаптированную Llama K для локального ИИ-рынка.
OpenAI выпустила открытые модели gpt-oss-safeguard для классификации безопасности контента с использованием цепочек рассуждений и настраиваемых политик безопасности.