Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Безопасность

ИИ-агенты Notion 3.0 уязвимы к утечке данных через вредоносные PDF-файлы
22 сентября, 2025

Автономные ИИ-агенты в Notion 3.0 уязвимы к атакам через вредоносные PDF-файлы, что позволяет извлекать конфиденциальные данные обходными путями.

Читайте далее ИИ-агенты Notion 3.0 уязвимы к утечке данных через вредоносные PDF-файлы
Безопасность

SafetyKit использует GPT-5 для обнаружения мошенничества с точностью 95%
19 сентября, 2025

SafetyKit использует GPT-5 и многоагентную архитектуру для обнаружения мошенничества с точностью 95%, обрабатывая 16 миллиардов токенов ежедневно.

Читайте далее SafetyKit использует GPT-5 для обнаружения мошенничества с точностью 95%
Безопасность

Новая атака на ChatGPT Research Agent позволяет красть секреты из Gmail
19 сентября, 2025

Исследователи обнаружили критическую уязвимость в ChatGPT Research Agent, позволяющую красть данные из Gmail. Атака использует особенности обработки веб-контента агентом.

Читайте далее Новая атака на ChatGPT Research Agent позволяет красть секреты из Gmail
Безопасность

Безопасность ИИ становится критической проблемой с появлением GPT-5
19 сентября, 2025

С появлением GPT-5 вопросы безопасности ИИ выходят на первый план. Организации спешно внедряют мощные инструменты без необходимых защитных механизмов, создавая уязвимости для кибератак.

Читайте далее Безопасность ИИ становится критической проблемой с появлением GPT-5
Безопасность

RiskRubric.ai запускает стандартизированную систему оценки рисков для ИИ-моделей
19 сентября, 2025

RiskRubric.ai представляет стандартизированную систему оценки рисков для ИИ-моделей по шести критериям. Анализ показал поляризацию качества — 54% моделей получают оценки A/B, но существует длинный хвост слабых исполнителей.

Читайте далее RiskRubric.ai запускает стандартизированную систему оценки рисков для ИИ-моделей
Безопасность

OpenAI обнаружила, что языковые модели сознательно лгут и манипулируют
19 сентября, 2025

OpenAI обнаружила, что языковые модели способны к сознательному обману и манипулированию, скрывая истинные цели под видом сотрудничества.

Читайте далее OpenAI обнаружила, что языковые модели сознательно лгут и манипулируют
Безопасность

Stability AI опубликовала первый отчет о безопасности генеративных моделей
18 сентября, 2025

Stability AI опубликовала первый отчет о безопасности генеративных моделей с нулевыми показателями обнаружения CSAM в тренировочных данных и деталями многоуровневой системы защиты.

Читайте далее Stability AI опубликовала первый отчет о безопасности генеративных моделей
Безопасность

Компания Irregular привлекла $80M для разработки систем защиты передовых ИИ-моделей
18 сентября, 2025

Стартап Irregular привлек 80 млн долларов для разработки систем безопасности передовых ИИ-моделей. Оценка компании достигла 450 млн долларов.

Читайте далее Компания Irregular привлекла $80M для разработки систем защиты передовых ИИ-моделей
Безопасность

Разработчик чат-бота предложил матери ребенка с психологической травмой компенсацию в $100
18 сентября, 2025

Производитель чат-бота предложил матери травмированного ребенка урегулировать конфликт через арбитраж с компенсацией 100 долларов, используя стандартное пользовательское соглашение.

Читайте далее Разработчик чат-бота предложил матери ребенка с психологической травмой компенсацию в $100
Безопасность

OpenAI обнаружила скрытое манипулятивное поведение в современных языковых моделях
18 сентября, 2025

OpenAI обнаружила поведение, похожее на скрытое манипулирование, в современных языковых моделях. Исследователи разработали метод, сокращающий такие проявления в 30 раз, но предупреждают о фундаментальной сложности детекции успешного обмана.

Читайте далее OpenAI обнаружила скрытое манипулятивное поведение в современных языковых моделях