Уже доступна Google Gemini 3 Flash — быстрая языковая модель для разработчиков
Google DeepMind анонсировала выход новой языковой модели Gemini 3 Flash, которая позиционируется как компромисс между высокой производительностью предшественника Gemini 3 Pro и скоростью работы, критичной для разработчиков. Модель уже доступна в API для программистов и постепенно внедряется в основные продукты компании, включая поиск и приложение Gemini, сообщает блог DeepMind.
Параметры и доступность
Gemini 3 Flash — это последнее пополнение в семействе моделей Gemini 3, представленном в прошлом месяце. Компания заявляет, что новая модель сохраняет «передовые» способности к рассуждению и мультимодальному пониманию, но оптимизирована для низкой задержки и стоимости, что делает её более подходящей для массового использования и итеративной разработки.
Модель становится доступной сразу в нескольких ключевых экосистемах Google:
- Для разработчиков: через Gemini API в Google AI Studio, Gemini CLI и новую платформу для агентной разработки Google Antigravity.
- Для широкой аудитории: в приложении Gemini и в режиме AI в Поиске.
- Для корпоративного сегмента: в Vertex AI и Gemini Enterprise.
Стратегия Google становится предельно ясной: они дробят свою флагманскую модель на специализированные версии, чтобы захватить все сегменты рынка. Flash — это попытка предложить «достаточно хороший» интеллект по доступной цене, что является прямым ответом на запросы разработчиков, уставших платить за избыточную мощь больших моделей в простых задачах. Вопрос в том, насколько реальная производительность в продакшене будет соответствовать заявленным benchmark’ам.
Производительность и эффективность
Согласно данным компании, Gemini 3 Flash демонстрирует конкурентоспособные результаты на сложных тестах. Заявленные показатели включают:
- 90.4% на тесте GPQA Diamond (PhD-уровень).
- 33.7% на Humanity’s Last Exam (без использования инструментов).
- 81.2% на мультидисциплинарном тесте MMMU Pro, что сравнимо с результатами Gemini 3 Pro.
Ключевым преимуществом заявлена эффективность. Модель способна модулировать «глубину размышлений» в зависимости от сложности задачи, что, по словам Google, позволяет в среднем использовать на 30% меньше токенов, чем у Gemini 2.5 Pro, для выполнения повседневных задач. Основной акцент сделан на скорости: Gemini 3 Flash, по данным бенчмарков Artificial Analysis, работает в 3 раза быстрее, чем 2.5 Pro.
В мультимодальном тесте MMMU-Pro, оценивающем понимание и рассуждения, Gemini 3 Flash и вовсе заняла первое место с результатом 81.2%, опередив Gemini 3 Pro (81%) и GPT-5.2 (79.5%). В бенчмарке SWE-bench Verified, который тестирует способности модели как кодирующего агента, Flash также лидирует среди моделей Google с показателем 78%, оставив позади Gemini 3 Pro (76.2%) и всю линейку Gemini 2.5.
Из 21 представленного Google теста Gemini 3 Flash показала лучший результат в трех, включая MMMU-Pro (разделив первое место с Pro), Toolathlon и MMMLU. Хотя Gemini 3 Pro все еще лидирует в большинстве тестов (14), а GPT-5.2 возглавляет восемь, сам факт, что «легкая» модель конкурирует с флагманами, говорит о многом.
Экономика разработчика: цена против мощности
Для разработчиков, интегрирующих языковые модели в свои продукты, новая модель представляет собой интересный компромисс. Стоимость использования Gemini 3 Flash составляет $0.50 за каждый миллион входных токенов (промпт) и $3.00 за миллион выходных токенов (ответ). Это значительно дешевле, чем у Gemini 3 Pro ($2.00/$12.00) и GPT-5.2 ($3.00/$15.00).
- Входные токены: $0.50 (Gemini 3 Flash) против $2.00 (Gemini 3 Pro) и $3.00 (GPT-5.2).
- Выходные токены: $3.00 (Flash) против $12.00 (Pro) и $15.00 (GPT-5.2).
При этом Google заявляет, что Gemini 3 Flash в среднем использует на 30% меньше токенов, чем Gemini 2.5 Pro, что дополнительно снижает затраты, и работает в три раза быстрее. Хотя она дороже предыдущей версии Flash ($0.30/$2.50) или Grok 4.1 Fast ($0.20/$0.50), ее производительность в тестах Google выше.
Фокус на разработчиков и агентные задачи
Особое внимание в анонсе уделено возможностям для программистов. Google позиционирует Gemini 3 Flash как идеальный инструмент для создания отзывчивых интерактивных приложений, production-систем и, что важно, для агентных рабочих процессов.
На тесте SWE-bench Verified, оценивающем способности кодирующих агентов, модель показала результат 78%, что, по заявлению компании, превосходит не только серию 2.5, но и Gemini 3 Pro. Это указывает на целенаправленную оптимизацию под задачи, где требуется быстрое принятие решений и использование инструментов.
Сильные стороны модели в рассуждениях, использовании инструментов и работе с мультимодальным контентом (видео, изображения, данные) делают её пригодной для сложного анализа, извлечения информации и визуальных вопросно-ответных систем.
