Featured image for claude haiku 4 5 ot anthropic dogonyaet flagmanskie modeli po proizvoditelnosti pri menshej stoimosti

Claude Haiku 4.5 от Anthropic догоняет флагманские модели по производительности при меньшей стоимости

Anthropic представила новую версию своей компактной языковой модели Claude Haiku 4.5, которая демонстрирует производительность, сравнимую с флагманской моделью компании пятимесячной давности, но при этом работает более чем в два раза быстрее и стоит на треть дешевле, сообщает Ars Technica.

Экономия без потери качества

Новая модель уже доступна всем пользователям приложения Claude, веб-версии и API. Если заявленные показатели Haiku 4.5 подтвердятся независимым тестированием, это будет означать серьезный прорыв в оптимизации языковых моделей — способность соответствовать производительности передовой кодирующей модели всего пятимесячной давности при одновременном снижении стоимости и увеличении скорости.

Anthropic предлагает семейство Claude в трех размерах: Haiku (малый), Sonnet (средний) и Opus (большой). Более крупные модели основаны на более обширных нейронных сетях и обычно обладают более глубокими контекстными знаниями, но работают медленнее и дороже.

Результаты бенчмарков Claude 4.5 Haiku от Anthropic

Технология дистилляции

Благодаря технике дистилляции компании вроде Anthropic смогли создать меньшие модели ИИ, которые соответствуют возможностям более крупных старых моделей в функциональных задачах, таких как программирование, хотя обычно это достигается за счет сокращения хранимых знаний.

Это означает, что если вам нужен ИИ для глубокого и содержательного анализа внешней политики или мировой истории, лучше выбрать Sonnet или Opus (помня, что они тоже могут ошибаться и выдумывать). Но если требуется быстрая помощь в программировании, больше ориентированная на перевод концепций, чем на общие знания, Haiku может быть лучшим выбором благодаря скорости и низкой стоимости.

Ценовая политика и производительность

Haiku 4.5 включена для подписчиков веб-планов и приложений Claude. Через API модель оценивается в $1 за миллион входных токенов и $5 за миллион выходных токенов. Для сравнения, Sonnet 4.5 стоит $3/$15, а Opus 4.1 — $15/$75 за миллион токенов соответственно.

Модель служит более дешевой заменой двум старым моделям — Haiku 3.5 и Sonnet 4. «Пользователи, которые полагаются на ИИ для задач реального времени с низкой задержкой, таких как чат-ассистенты, агенты обслуживания клиентов или парное программирование, оценят сочетание высокой интеллектуальности и замечательной скорости Haiku 4.5», — пишет Anthropic.

На тесте SWE-bench Verified, измеряющем производительность в задачах программирования, Haiku 4.5 показала 73,3% по сравнению с аналогичным уровнем Sonnet 4 (72,7%). Модель также, согласно бенчмаркам Anthropic, превосходит Sonnet 4 в определенных задачах, таких как использование компьютеров.

Создание компактных, но мощных моделей — это настоящий тренд, который переворачивает представление о том, что качество требует огромных вычислительных ресурсов. Haiku 4.5 демонстрирует, что можно получить почти такую же производительность в программировании за треть цены — это серьезный удар по бизнес-моделям, построенным на продаже дорогих вычислений. Интересно, как на это отреагируют конкуренты.

Сравнение с конкурентами

Haiku 4.5 удивительно близко подбирается к тому, чего может достичь GPT-5 от OpenAI в этом конкретном наборе тестов, хотя, поскольку результаты самоотчетные и потенциально подобраны для соответствия сильным сторонам модели, к ним стоит относиться с долей скептицизма.

Тем не менее, создание небольшой, но способной модели программирования может иметь неожиданные преимущества для агентских настроек кодирования, таких как Claude Code. Anthropic разработала Haiku 4.5 для работы вместе с Sonnet 4.5 в многомодельных рабочих процессах. В такой конфигурации Sonnet 4.5 мог бы разбивать сложные проблемы на многошаговые планы, а затем координировать несколько экземпляров Haiku 4.5 для выполнения подзадач параллельно, подобно распределению рабочих для ускорения процесса.

Claude Sonnet 4.5, выпущенный в конце сентября, остается передовой моделью Anthropic и тем, что компания называет «лучшей доступной моделью для программирования».

Похожие записи