Перейти к основному содержанию

Gemini 3.5 Flash vs Gemini 3.1 Flash-Lite: какую модель Gemini API выбрать

A
5 мин чтенияAI Model Comparison

Gemini 3.5 Flash стоит тестировать для agent, coding и сложных tool loops. Gemini 3.1 Flash-Lite остается лучшим первым выбором для массовых простых задач с низкой стоимостью.

Gemini 3.5 Flash vs Gemini 3.1 Flash-Lite: какую модель Gemini API выбрать

На 21 мая 2026 года безопасный ответ звучит так: новая модель не всегда должна заменить старую. Используйте gemini-3.5-flash, когда качество в agent, coding, tool-heavy и long-context задачах уменьшает retries и review time. Используйте gemini-3.1-flash-lite, когда задача простая, массовая, чувствительная к цене и уже достаточно точная.

Быстрый ответ

СитуацияПервый маршрутПочему
Coding agents, tool loops, multi-step analysis, product assistantsGemini 3.5 FlashПлатите за более сильный маршрут только если он снижает retries, tool failures и review time.
Bulk extraction, translation, classification, moderation, short summariesGemini 3.1 Flash-LiteБолее низкие Standard и Batch/Flex строки важны, если качество уже достаточно.
Не уверены или меняете production defaultОставьте обаЗапустите одну и ту же задачу, логируйте качество, стоимость, latency, retries и review.
Image output, audio output, Live API, Computer UseНи одинНужен Gemini route, который явно поддерживает этот runtime.

Это routing decision по workload, а не спор вокруг одного benchmark. У моделей очень похожий публичный API contract, поэтому выбор держится на quality per task versus cost per task. Если Flash-Lite уже точен и дешев, глобальная замена только поднимет цену. Если Flash-Lite создает retries, tool failures или ручную правку, Gemini 3.5 Flash может оказаться дешевле в полном workflow.

Официальный контракт

Official contract comparison for Gemini 3.5 Flash and Gemini 3.1 Flash-Lite

Текущие страницы Google model docs показывают gemini-3.5-flash и gemini-3.1-flash-lite как stable Gemini API models. Обе строки принимают text, image, video, audio и PDF input, обе дают text output, и обе имеют 1,048,576 input tokens плюс 65,536 output tokens.

Feature checklist тоже не решает выбор автоматически. В snapshot от 21 мая обе строки показывают Batch API, caching, code execution, file search, function calling, Google Search grounding, Google Maps grounding, structured outputs, thinking, URL context, Flex и Priority. Поэтому вопрос не в том, умеет ли Flash-Lite tools, а в том, выигрывает ли он вашу конкретную задачу.

Contract itemGemini 3.5 FlashGemini 3.1 Flash-Lite
API model IDgemini-3.5-flashgemini-3.1-flash-lite
StatusStableStable
Input and outputMultimodal input, text outputMultimodal input, text output
Token window1,048,576 input, 65,536 output1,048,576 input, 65,536 output
Practical readQuality routeLow-cost volume route

Важный stop rule: ни одну из этих строк не стоит описывать как image generation, audio generation, Live API или Computer Use route, пока официальная model page не изменится.

Цена и полная стоимость workflow

Gemini 3.5 Flash and Flash-Lite cost route map

В pricing snapshot от 21 мая paid Standard для Gemini 3.5 Flash стоит $1.50 input и $9.00 output за 1M tokens. Gemini 3.1 Flash-Lite стоит $0.30 input и $2.50 output. Batch/Flex также дешевле у Flash-Lite: $0.75/$4.50 для 3.5 Flash против $0.15/$1.25 для Flash-Lite. Pricing page показывает Free Tier rows для Standard usage, но доступ зависит от account, billing, region, quota и live docs.

Считать нужно не только token price. Для agentic work важны retry count, tool failure, schema failure и human review minutes. Более дорогая модель выигрывает, если убирает два failed tool loops. Более дешевая модель выигрывает, если задача проверяемая, простая и повторяется много раз.

Workload routing matrix

Главная ось - cost of failure. Если ошибка создает debugging time, плохой код, tool churn или escalation, тестируйте 3.5 Flash первым. Если результат легко проверить и task повторяется на масштабе, начинайте с Flash-Lite.

WorkloadFirst testKeep the other route for
Coding-agent traces3.5 FlashCheap lint summaries or issue classification.
Multimodal support tickets3.5 FlashTagging and routing after the schema is simple.
Translation and rewrite variantsFlash-LiteAmbiguous source text or brand-sensitive copy rescue.
Data extractionFlash-LiteMixed PDFs, long evidence packs, brittle validation.
Product-facing assistant3.5 FlashLow-risk background summaries.

Не заменяйте один global Gemini default другим global default. Держите quality route и margin route в config, затем распределяйте task classes.

Same-task switch checklist

Same-task switch checklist for Gemini 3.5 Flash and Gemini 3.1 Flash-Lite

Перед production change запустите одну и ту же задачу по двум маршрутам. Тот же prompt, inputs, retrieval pack, tools, timeout, token budget и validator. Логируйте model ID, price mode, latency, retries, input tokens, output tokens, tool failures, schema failures, reviewer minutes и accepted result.

Продвигайте Gemini 3.5 Flash только когда он снижает total workflow cost или заметно улучшает accepted quality. Сохраняйте Flash-Lite, если задача остается правильной, дешевой и проверяемой. Оставьте оба маршрута до двух успешных eval rounds.

Adjacent Gemini decisions

For narrower Gemini follow-ups, use Gemini 3.5 Flash capabilities, Gemini API free tier, Gemini API vs Vertex AI, Flash-family runtime guide. Источники проверены 21 мая 2026 года: Google AI model pages, Gemini API pricing, changelog, deprecations и Google launch post. Pricing, free-tier access, model availability, and preview shutdown dates can change, so recheck the live official pages before changing production defaults.

Часто задаваемые вопросы

Gemini 3.5 Flash всегда лучше?

Нет. Он сильнее как first test для complex agent and coding work, но Flash-Lite может быть лучшим production default для простых массовых задач.

Обе модели stable?

В официальном snapshot от 21 мая 2026 года обе строки, gemini-3.5-flash и gemini-3.1-flash-lite, указаны как stable.

Можно ли использовать Flash-Lite preview?

Для production используйте stable gemini-3.1-flash-lite. Google deprecations page указывает shutdown для gemini-3.1-flash-lite-preview на 25 мая 2026 года.

Что дешевле?

По paid Standard и Batch/Flex snapshot от 21 мая Flash-Lite дешевле. Перед публикацией hard numbers нужно заново проверить official pricing page.

Нужно ли держать оба route?

Да. Production team должна иметь quality route и margin route, а не один global model switch.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус