Claude Haiku 4.5 от Anthropic: скорость и экономия без потерь

Anthropic представила новую версию своей компактной языковой модели Claude Haiku 4.5, которая демонстрирует производительность, сравнимую с флагманской моделью компании пятимесячной давности, но при этом работает более чем в два раза быстрее и стоит на треть дешевле, сообщает Ars Technica.

Экономия без потери качества

Новая модель уже доступна всем пользователям приложения Claude, веб-версии и API. Если заявленные показатели Haiku 4.5 подтвердятся независимым тестированием, это будет означать серьезный прорыв в оптимизации языковых моделей — способность соответствовать производительности передовой кодирующей модели всего пятимесячной давности при одновременном снижении стоимости и увеличении скорости.

Anthropic предлагает семейство Claude в трех размерах: Haiku (малый), Sonnet (средний) и Opus (большой). Более крупные модели основаны на более обширных нейронных сетях и обычно обладают более глубокими контекстными знаниями, но работают медленнее и дороже.

Результаты бенчмарков Claude 4.5 Haiku от Anthropic

Технология дистилляции

Благодаря технике дистилляции компании вроде Anthropic смогли создать меньшие модели ИИ, которые соответствуют возможностям более крупных старых моделей в функциональных задачах, таких как программирование, хотя обычно это достигается за счет сокращения хранимых знаний.

Это означает, что если вам нужен ИИ для глубокого и содержательного анализа внешней политики или мировой истории, лучше выбрать Sonnet или Opus (помня, что они тоже могут ошибаться и выдумывать). Но если требуется быстрая помощь в программировании, больше ориентированная на перевод концепций, чем на общие знания, Haiku может быть лучшим выбором благодаря скорости и низкой стоимости.

Ценовая политика и производительность

Haiku 4.5 включена для подписчиков веб-планов и приложений Claude. Через API модель оценивается в $1 за миллион входных токенов и $5 за миллион выходных токенов. Для сравнения, Sonnet 4.5 стоит $3/$15, а Opus 4.1 — $15/$75 за миллион токенов соответственно.

Модель служит более дешевой заменой двум старым моделям — Haiku 3.5 и Sonnet 4. «Пользователи, которые полагаются на ИИ для задач реального времени с низкой задержкой, таких как чат-ассистенты, агенты обслуживания клиентов или парное программирование, оценят сочетание высокой интеллектуальности и замечательной скорости Haiku 4.5», — пишет Anthropic.

На тесте SWE-bench Verified, измеряющем производительность в задачах программирования, Haiku 4.5 показала 73,3% по сравнению с аналогичным уровнем Sonnet 4 (72,7%). Модель также, согласно бенчмаркам Anthropic, превосходит Sonnet 4 в определенных задачах, таких как использование компьютеров.

Создание компактных, но мощных моделей — это настоящий тренд, который переворачивает представление о том, что качество требует огромных вычислительных ресурсов. Haiku 4.5 демонстрирует, что можно получить почти такую же производительность в программировании за треть цены — это серьезный удар по бизнес-моделям, построенным на продаже дорогих вычислений. Интересно, как на это отреагируют конкуренты.

Сравнение с конкурентами

Haiku 4.5 удивительно близко подбирается к тому, чего может достичь GPT-5 от OpenAI в этом конкретном наборе тестов, хотя, поскольку результаты самоотчетные и потенциально подобраны для соответствия сильным сторонам модели, к ним стоит относиться с долей скептицизма.

Тем не менее, создание небольшой, но способной модели программирования может иметь неожиданные преимущества для агентских настроек кодирования, таких как Claude Code. Anthropic разработала Haiku 4.5 для работы вместе с Sonnet 4.5 в многомодельных рабочих процессах. В такой конфигурации Sonnet 4.5 мог бы разбивать сложные проблемы на многошаговые планы, а затем координировать несколько экземпляров Haiku 4.5 для выполнения подзадач параллельно, подобно распределению рабочих для ускорения процесса.

Claude Sonnet 4.5, выпущенный в конце сентября, остается передовой моделью Anthropic и тем, что компания называет «лучшей доступной моделью для программирования».

Claude Haiku 4.5 от Anthropic догоняет флагманские модели по производительности при меньшей стоимости

Экономия без потери качества

Технология дистилляции

Ценовая политика и производительность

Сравнение с конкурентами

Cloudflare запускает защиту промптов для безопасной работы с генеративным ИИ

Новый ИИ-редактор изображений от OpenAI за несколько секунд может создавать фейковые фото

ИИ провалил тесты по финансам и юриспруденции в новом реалистичном бенчмарке

Traba автоматизировала уже 250 тысяч собеседований с помощью ИИ-агентов

Microsoft интегрирует Copilot прямо в ячейки Excel через новую функцию

DeepSeek выпустил открытую математическую модель уровня победителя олимпиады

Экономия без потери качества

Технология дистилляции

Ценовая политика и производительность

Сравнение с конкурентами

Похожие записи