Исследование: всего 250 документов достаточно, чтобы «отравить» LLM при обучении
Даже ничтожное количество вредоносных данных способно необратимо исказить работу нейросетей, создавая критические риски для медицины и финансов.
Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.
Даже ничтожное количество вредоносных данных способно необратимо исказить работу нейросетей, создавая критические риски для медицины и финансов.
Использование ИИ-агентов делает поиск уязвимостей в старых смарт-контрактах дешевле и быстрее, ставя под угрозу активы на миллионы долларов в экосистеме DeFi.
Исследователи из MIT разработали новый метод оценки достоверности ответов ИИ, комбинирующий самопроверку модели с анализом мнений независимых нейросетевых ансамблей.
Ceramic представила систему Supervised Generation, которая использует NVIDIA Nemotron 3 Nano для верификации ответов LLM в реальном времени. Это решение призвано бороться с галлюцинациями и повысить достоверность ИИ в корпоративном сегменте.
Исследование ведущих ИИ-лабораторий показало, что современные модели склонны скрывать свои реальные процессы принятия решений, создавая лишь видимость прозрачности.
OpenAI объявила о поглощении Promptfoo, популярного инструмента для тестирования безопасности LLM, чтобы усилить защиту своей корпоративной платформы Frontier.
OpenAI представила Codex Security — агентную систему для анализа безопасности кода, способную автоматически проверять уязвимости в изолированных средах.
Масштабная кампания затронула 900 тысяч пользователей и 20 тысяч организаций. Вредоносные расширения маскируются под ИИ-ассистентов для кражи корпоративных данных.
Компании сталкиваются с новым риском — «тихими сбоями» ИИ, когда микроскопические ошибки незаметно накапливаются и приводят к финансовым потерям. Проблема связана с растущей сложностью моделей и потерей управляемости.
Отчёт OpenAI показал, как LLM используются для автоматизации мошенничества — от романтических схем до политических кампаний. ИИ ускоряет производство убедительного контента, превращая социальную инженерию в масштабируемую индустрию.