Anthropic выпустила открытый инструмент Petri для автоматического аудита безопасности AI-моделей
Anthropic выпустила открытый инструмент Petri для автоматического аудита безопасности AI-моделей с использованием AI-агентов. В тестах 14 моделей выявлены проблемы с обманом и разглашением информации.
