Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Безопасность

Сгенерированные LLM пароли оказались слабыми, несмотря на внешнюю сложность
23 февраля, 2026

Пароли от LLM выглядят сложными, но повторяются и предсказуемы. Исследование показало критически низкую реальную энтропию и реальные риски для кода и инфраструктуры.

Читайте далее Сгенерированные LLM пароли оказались слабыми, несмотря на внешнюю сложность
Безопасность

Anthropic запустила ИИ-сканер уязвимостей Claude Code Security
23 февраля, 2026

Claude Code Security от Anthropic «читает» код, как исследователь: понимает потоки данных, находит логику ошибок и генерирует патчи с рейтингом. Минус ложных позитивов — многоступенчатая проверка ИИ. Уже нашёл 500+ багов в open-source, но риски: такие же инструменты помогут хакерам.

Читайте далее Anthropic запустила ИИ-сканер уязвимостей Claude Code Security
Безопасность

Дрейф агентных ИИ-систем: скрытая угроза, которую не ловят тесты
19 февраля, 2026

Агентные ИИ не ломаются внезапно: они дрейфуют — меняют поведение от обновлений промптов и инструментов, накапливая риски месяцами. Традиционные тесты не ловят это, нужна поведенческая диагностика для CIO и CTO.

Читайте далее Дрейф агентных ИИ-систем: скрытая угроза, которую не ловят тесты
Безопасность

Браузерные расширения могут собирать диалоги пользователей с ИИ ради рекламы
18 декабря, 2025

Восемь популярных браузерных расширений с 8 млн установок тайно собирают полные диалоги пользователей с ChatGPT, Claude и другими ИИ для продажи маркетологам. Расширения обещают защиту, но сами являются инструментом слежки.

Читайте далее Браузерные расширения могут собирать диалоги пользователей с ИИ ради рекламы
Безопасность

Бенчмарк Phare V2 показал, что современные и продвинутые LLM не становятся безопаснее
17 декабря, 2025

Новое исследование Phare V2 показывает, что прогресс в возможностях языковых моделей не привел к аналогичному улучшению их безопасности. Рассуждающие модели не стали устойчивее к взлому, галлюцинациям и предвзятости.

Читайте далее Бенчмарк Phare V2 показал, что современные и продвинутые LLM не становятся безопаснее
Безопасность

Браузеры с ИИ-агентами — это удобно, но проблемы с безопасностью не решаются
17 декабря, 202517 января, 2026

Новые браузеры с ИИ-агентами, которые могут действовать в интернете от вашего имени, сталкиваются с серьезными проблемами безопасности, включая уязвимости к скрытым командам и риск компрометации личных данных.

Читайте далее Браузеры с ИИ-агентами — это удобно, но проблемы с безопасностью не решаются
Безопасность

Противники ИИ не сдаются, несмотря на то, что их прогнозы конца света провалились
16 декабря, 2025

Сторонники теории скорого апокалипсиса от ИИ, чьи прогнозы не сбылись, не сдаются. Вместо этого они перешли от научных дискуссий к политическому лоббизму, находя поддержку у регуляторов.

Читайте далее Противники ИИ не сдаются, несмотря на то, что их прогнозы конца света провалились
Безопасность

Почему правила Азимова для ИИ не работают в реальном мире
16 декабря, 2025

Почему классические законы робототехники Азимова не работают для современных ИИ, и почему попытки создать «этичный ИИ» сталкиваются с фундаментальными противоречиями в реальном мире.

Читайте далее Почему правила Азимова для ИИ не работают в реальном мире
Безопасность

Почему «детекторы ChatGPT» до сих пор не могут определить текст, написанный ИИ
16 декабря, 2025

Анализ эффективности инструментов для обнаружения текста, сгенерированного ChatGPT. Рассматриваются принципы работы детекторов, их сильные и слабые стороны, а также правильные стратегии использования.

Читайте далее Почему «детекторы ChatGPT» до сих пор не могут определить текст, написанный ИИ
Безопасность

Исследователи научились удалять опасные знания о ментальном здоровье из LLM
15 декабря, 2025

Новая техника машинного обучения позволяет находить и удалять опасные знания о психическом здоровье из языковых моделей, решая проблему вредоносных советов, которые ИИ усваивает из интернета.

Читайте далее Исследователи научились удалять опасные знания о ментальном здоровье из LLM