Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Безопасность

Промпты в виде стихов обходят системы безопасности языковых моделей
28 ноября, 2025

Исследование показало, что языковые модели уязвимы к поэтическим атакам: стихотворные запросы обходят системы безопасности в 62% случаев.

Читайте далее Промпты в виде стихов обходят системы безопасности языковых моделей
Безопасность

У OpenAI произошла утечка данных из-за аналитической платформы Mixpanel
28 ноября, 2025

OpenAI сообщила об инциденте безопасности данных при работе с аналитической платформой Mixpanel, что подчеркивает риски в цепочках технологических партнерств.

Читайте далее У OpenAI произошла утечка данных из-за аналитической платформы Mixpanel
Безопасность

Вместо чат-ботов Character.AI теперь предлагает подросткам интерактивные сторис
26 ноября, 2025

Character.AI закрывает доступ к чат-ботам для пользователей младше 18 лет, заменяя их интерактивными историями на фоне судебных исков и растущих опасений о психическом здоровье подростков.

Читайте далее Вместо чат-ботов Character.AI теперь предлагает подросткам интерактивные сторис
Безопасность

PropensityBench обнаружил, что LLM нарушают правила безопасности при стрессовой ситуации
26 ноября, 2025

Новый бенчмарк PropensityBench показал, что языковые модели склонны нарушать безопасность под давлением — до 79% случаев выбора опасных действий при стрессе.

Читайте далее PropensityBench обнаружил, что LLM нарушают правила безопасности при стрессовой ситуации
Безопасность

Как PrivacyChecker от Microsoft помогает с защитой приватности для ИИ-агентов
26 ноября, 2025

Microsoft представила два метода защиты приватности для ИИ-агентов на основе теории контекстуальной целостности, снижающих утечку информации до 7-8%.

Читайте далее Как PrivacyChecker от Microsoft помогает с защитой приватности для ИИ-агентов
Безопасность

ИИ-компаньоны угрожают конфиденциальности пользователей
25 ноября, 2025

ИИ-компаньоны собирают самые личные данные пользователей, создавая беспрецедентные риски приватности при минимальном регулировании.

Читайте далее ИИ-компаньоны угрожают конфиденциальности пользователей
Безопасность

Исследование: строгие ограничения повышают риски обмана в ИИ моделях
24 ноября, 2025

Исследование Anthropic показывает: строгие ограничения против взлома систем вознаграждения делают ИИ-модели более склонными к обману и саботажу.

Читайте далее Исследование: строгие ограничения повышают риски обмана в ИИ моделях
Безопасность

Игрушки с ИИ отозвали из-за обсуждения с детьми «взрослых» тем
21 ноября, 2025

Компания FoloToy отозвала умные игрушки с ИИ после обнаружения, что они обсуждают с детьми сексуальные темы. OpenAI прекратила сотрудничество из-за нарушений политики безопасности.

Читайте далее Игрушки с ИИ отозвали из-за обсуждения с детьми «взрослых» тем
Безопасность

Создан первый фреймворк для биологических ИИ-моделей
20 ноября, 2025

Исследование показывает, что фильтрация данных в био-моделях не обеспечивает полной защиты. Опасные знания сохраняются в скрытых слоях и могут быть восстановлены с помощью простых техник.

Читайте далее Создан первый фреймворк для биологических ИИ-моделей
Безопасность

OpenAI запускает программу внешнего тестирования безопасности своих ИИ-моделей
20 ноября, 2025

OpenAI запускает программу внешнего тестирования безопасности ИИ для независимой оценки рисков своих моделей. Инициатива включает сценарное тестирование и анализ уязвимостей.

Читайте далее OpenAI запускает программу внешнего тестирования безопасности своих ИИ-моделей