Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Безопасность

LLM могут быть поражены через непрямые инъекции промптов даже при локальном запуске
10 июня, 2026

Исследователи обнаружили, что локальные ИИ-модели так же уязвимы к непрямым инъекциям промптов, как и облачные, из-за архитектурных особенностей LLM.

Читайте далее LLM могут быть поражены через непрямые инъекции промптов даже при локальном запуске
Безопасность

ChatGPT вводит режим Lockdown Mode, изолирующий нейросеть от внешнего мира
8 июня, 2026

OpenAI представила Lockdown Mode для ChatGPT — новый инструмент безопасности, ограничивающий доступ к интернету для защиты данных от сложных атак.

Читайте далее ChatGPT вводит режим Lockdown Mode, изолирующий нейросеть от внешнего мира
Безопасность

Автономного ИИ-агента обучили полному циклу взлома сайтов на Salesforce Experience Cloud
8 июня, 2026

Автономный ИИ-агент научился проводить полный цикл кибератаки на сайты Salesforce Experience Cloud, используя LLM для написания эксплойтов и анализа данных.

Читайте далее Автономного ИИ-агента обучили полному циклу взлома сайтов на Salesforce Experience Cloud
Безопасность

Исследователи создали самовоспроизводящегося ИИ-червя на базе локальных LLM
4 июня, 2026

Ученые из Университета Торонто создали прототип вредоносного ПО, которое использует локальные ИИ-модели для поиска уязвимостей и самораспространения.

Читайте далее Исследователи создали самовоспроизводящегося ИИ-червя на базе локальных LLM
Безопасность

Уязвимость в ИИ-чатботе поддержки Meta* позволила хакерам захватить аккаунты Instagram
3 июня, 2026

Злоумышленники захватили высокопрофильные аккаунты Instagram, убедив чат-бота Meta* AI изменить электронную почту и обойти двухфакторную аутентификацию.

Читайте далее Уязвимость в ИИ-чатботе поддержки Meta* позволила хакерам захватить аккаунты Instagram
Безопасность

Исследование показало, что LLM доверяют ложным документам даже вопреки предупреждениям
29 мая, 2026

Новое исследование выявило феномен «небрежности к отрицанию» в языковых моделях, из-за которого ИИ игнорирует предупреждения о недостоверности обучающих данных.

Читайте далее Исследование показало, что LLM доверяют ложным документам даже вопреки предупреждениям
Безопасность

Новый бенчмарк DeepSWE раскрыл уязвимости моделей Claude и сделал лидером GPT-5.5
27 мая, 2026

Стартап Datacurve представил DeepSWE — новый бенчмарк для ИИ-кодеров, который выявил превосходство GPT-5.5 и критические ошибки в старых методах оценки.

Читайте далее Новый бенчмарк DeepSWE раскрыл уязвимости моделей Claude и сделал лидером GPT-5.5
Безопасность

Устойчивость к взлому: DeepSeek проиграл GPT в вопросах безопасности
26 мая, 2026

Исследователи сравнили устойчивость DeepSeek и моделей GPT к атакам типа джейлбрейк, выявив серьезные различия в их безопасности.

Читайте далее Устойчивость к взлому: DeepSeek проиграл GPT в вопросах безопасности
Безопасность

Google интегрирует CodeMender в экосистему агентов для автоматизации безопасности
22 мая, 2026

Google переводит ИИ-агента CodeMender из разряда автономных инструментов в состав комплексной платформы Agent Platform для управления безопасностью приложений.

Читайте далее Google интегрирует CodeMender в экосистему агентов для автоматизации безопасности
Безопасность

Эпоха Vulnpocalypse: новые модели ИИ находят в семь раз больше уязвимостей
14 мая, 2026

Использование новых моделей ИИ от Anthropic и OpenAI позволило Palo Alto Networks обнаружить в семь раз больше уязвимостей в своих продуктах, чем обычно.

Читайте далее Эпоха Vulnpocalypse: новые модели ИИ находят в семь раз больше уязвимостей