Исследование показало, что военные ИИ-системы склонны оценивать стоимость жизни человека
Коммерческие ИИ-модели начали использовать в военном планировании США, что привело к алгоритмической оценке стоимости человеческих жизней.
Claude — передовой AI-ассистент от Anthropic. Известен своей безопасностью, точностью и способностью к глубокому анализу. Конкурент ChatGPT с упором на этичность.
Коммерческие ИИ-модели начали использовать в военном планировании США, что привело к алгоритмической оценке стоимости человеческих жизней.
Anthropic обновила Claude, добавив бесплатную функцию памяти и инструмент переноса данных из других чат-ботов. Компания рассчитывает таким образом привлечь пользователей из экосистем ChatGPT и Gemini.
Сообщается, что ИИ Claude использовался американскими военными вскоре после приказа о прекращении сотрудничества с Anthropic. Инцидент подчеркнул технологическую зависимость оборонных систем от гражданских ИИ-разработок и усилил дискуссию о роли LLM в современной войне.
Anthropic развивает Claude как корпоративного ИИ-агента, интегрируя его с профессиональными данными и бизнес-сервисами. Стратегия направлена на уход от потребительского сегмента к автоматизации рабочих процессов в финансах и управлении.
Сделка с Vercept усиливает стратегию Anthropic по развитию «computer use» — способности Claude работать с реальными приложениями. Несмотря на прогресс в тестах, массовое внедрение таких агентских функций пока остаётся вызовом.
Новое исследование Phare V2 показывает, что прогресс в возможностях языковых моделей не привел к аналогичному улучшению их безопасности. Рассуждающие модели не стали устойчивее к взлому, галлюцинациям и предвзятости.
Sonar опубликовала рейтинг качества кода от ведущих языковых моделей, включая GPT-5.2, Opus 4.5 и Gemini 3. Исследование показало компромиссы между производительностью и качеством кода.
Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.
Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.
Anthropic запускает Claude Code в Slack, позволяя разработчикам делегировать задачи программирования напрямую из чатов. Интеграция знаменует сдвиг AI-ассистентов из IDE в инструменты коллаборации.