Как решить проблему нестабильности LLM-оценок в корпоративных приложениях
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.
Anthropic — провайдер LLM и разработчик семейства моделей Claude, доступных через веб-чат Claude и публичный API.
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.
Anthropic опубликовала географический анализ использования ИИ Claude, выявивший сильную корреляцию между экономическим развитием регионов и уровнем внедрения искусственного интеллекта.
Фундаментальные модели ИИ теряют уникальность и становятся товаром, что угрожает бизнес-модели гигантов вроде OpenAI и Anthropic. Стартапы теперь легко меняют базовые модели, фокусируясь на интерфейсах и специализации.
Anthropic раскрыла детали годового сотрудничества с правительственными институтами США и Великобритании по тестированию систем безопасности ИИ. Партнерство позволило выявить критические уязвимости до публичного развертывания моделей.
Anthropic запустила функцию памяти для Claude с изоляцией по проектам и инкогнито-режимом. Доступно для корпоративных тарифов с полным контролем данных.
Крупный сбой AI-сервиса для разработчиков показал степень зависимости программистов от искусственного интеллекта в повседневной работе.
Microsoft интегрирует ИИ Claude от Anthropic в Office после тестов, показавших его превосходство над GPT в некоторых бизнес-задачах.
Модели TII Falcon H1 стали доступны в Amazon Bedrock и SageMaker JumpStart, предлагая разработчикам мощные open-source альтернативы для генерации текста.
LSEG внедрила ИИ-систему на Amazon Bedrock для автоматического анализа финансовых новостей и обнаружения рыночных манипуляций, обрабатывая 250 тыс. статей.
Anthropic запустила революционную функцию для Claude: создание и редактирование Excel, документов, презентаций и PDF в реальном времени через чат-интерфейс.