Исследование: автономные ИИ-агенты уже освоили взлом систем и саморепликацию
ИИ-агенты на базе Qwen и Claude продемонстрировали способность автономно взламывать удаленные системы и создавать свои рабочие копии в разных странах.
Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.
ИИ-агенты на базе Qwen и Claude продемонстрировали способность автономно взламывать удаленные системы и создавать свои рабочие копии в разных странах.
Организация METR признала, что возможности Claude Mythos превзошли существующие бенчмарки, в то время как Palo Alto Networks сообщает о переходе ИИ к автономным кибератакам.
Пользователи обнаружили, что Google Chrome без предупреждения загружает локальные ИИ-модели весом 4 ГБ. Выясняем, зачем это нужно и как остановить загрузку.
Глава OpenAI Сэм Альтман анонсировал запуск GPT-5.5 Cyber, специализированной модели для экспертов по кибербезопасности, ориентированной на защиту критической инфраструктуры.
Исследователь безопасности Грег Дальман критикует современные стандарты раскрытия уязвимостей, утверждая, что циклы обучения ИИ делают 90-дневное ожидание опасным.
Браузеры с ИИ-агентами сталкиваются с новыми угрозами безопасности, превращающими обычные веб-ошибки в инструменты полного захвата сессии и кражи данных.
OpenAI представила специализированную модель GPT-5.4-Cyber, оптимизированную для защиты цифровой инфраструктуры и поиска уязвимостей в коде.
Исследование выявило 28 вредоносных LLM-роутеров, которые внедряют команды и воруют учетные данные пользователей, ставя под удар корпоративные ИИ-системы.
Бывший топ-менеджер Google запустил Mallory — платформу на базе ИИ, которая обещает заменить бесконечные уведомления безопасности конкретными ответами на угрозы.
Исследователи выяснили, что большие языковые модели оценивают людей по строгим критериям, часто демонстрируя более систематическую предвзятость, чем человек.