メインコンテンツへスキップ

Gemini 3.5 Flash と Gemini 3.1 Flash-Lite の選び方:Gemini API 比較

A
10 分で読めますAIモデル比較

複雑な agent、coding、tool loop では Gemini 3.5 Flash を検証し、大量で単純な処理では Gemini 3.1 Flash-Lite を維持します。

Gemini 3.5 Flash と Gemini 3.1 Flash-Lite の選び方:Gemini API 比較

2026年5月21日時点の安全な答えは、「新しいモデルだから必ず置き換える」ではありません。agent、coding、tool-heavy、long-context の品質で retries と review time が減るなら gemini-3.5-flash を試します。単純で大量、価格に敏感で、すでに精度が十分なら gemini-3.1-flash-lite を維持します。

速い結論

状況最初に試す route理由
coding agents、tool loops、多段分析、product assistantGemini 3.5 Flash高い token price は retries、tool failures、review time を減らす時だけ意味があります。
bulk extraction、translation、classification、moderation、short summariesGemini 3.1 Flash-Lite品質が足りているなら低い Standard / Batch / Flex 価格が効きます。
production default を変える前両方を route同一 task で quality、cost、latency、retries、review time を測ります。
image output、audio output、Live API、Computer Useどちらでもないその runtime を明示的にサポートする Gemini route を使います。

これは workload routing decision です。2つのモデルは public API contract がかなり近いため、feature list だけでは選べません。Flash-Lite が正確で安いなら全体置換はコスト増です。Flash-Lite が retries、tool failures、人手修正を生むなら、3.5 Flash の方が full workflow では安くなることがあります。

公式契約スナップショット

Official contract comparison for Gemini 3.5 Flash and Gemini 3.1 Flash-Lite

Google の current model pages では gemini-3.5-flashgemini-3.1-flash-lite がどちらも stable Gemini API model として表示されています。どちらも text、image、video、audio、PDF input を受け、text output を返し、1,048,576 input tokens と 65,536 output tokens の window を持ちます。

May 21 snapshot では、Batch API、caching、code execution、file search、function calling、Google Search grounding、Google Maps grounding、structured outputs、thinking、URL context、Flex、Priority が両方に並びます。つまり重要なのは「Flash-Lite が tools を使えるか」ではなく、「その task class で十分勝てるか」です。

Contract itemGemini 3.5 FlashGemini 3.1 Flash-Lite
API model IDgemini-3.5-flashgemini-3.1-flash-lite
StatusStableStable
Input and outputMultimodal input, text outputMultimodal input, text output
Token window1,048,576 input, 65,536 output1,048,576 input, 65,536 output
Practical readQuality routeLow-cost volume route

また、image generation、audio generation、Live API、Computer Use の route としてこの2行を扱わないことが重要です。公式 model page が変わるまでは sibling route の問題です。

価格と workflow cost

Gemini 3.5 Flash and Flash-Lite cost route map

2026年5月21日の pricing snapshot では、Gemini 3.5 Flash paid Standard は $1.50 input / $9.00 output per 1M tokens です。Gemini 3.1 Flash-Lite は $0.30 input / $2.50 output です。Batch/Flex でも 3.5 Flash は $0.75/$4.50、Flash-Lite は $0.15/$1.25 です。Pricing page は Standard usage に Free Tier rows を表示していますが、実際の access は account、billing、region、quota、live docs に依存します。

token price だけで判断しないでください。agentic work では retries、tool failure、schema failure、human review minutes が大きくなります。高いモデルでも失敗を減らせば安くなります。単純で検証しやすい task では、安いモデルがそのまま勝ちます。

Workload routing matrix

判断軸は failure cost です。間違いが debugging time、bad code、tool churn、support escalation を生むなら 3.5 Flash を先に試します。結果を安く検証でき、大量に繰り返すなら Flash-Lite が先です。

WorkloadFirst testKeep the other route for
Coding-agent traces3.5 Flashcheap lint summaries or issue classification.
Multimodal support tickets3.5 Flashtagging and routing after schema is simple.
Translation and rewrite variantsFlash-Liteambiguous source or brand-sensitive copy.
Data extractionFlash-Litemixed PDFs, long evidence packs, brittle validation.
Product assistant3.5 Flashlow-risk background summaries.

global Gemini default を一気に置き換えないでください。config には quality route と margin route を残し、task class ごとに割り当てます。

Same-task switch checklist

Same-task switch checklist for Gemini 3.5 Flash and Gemini 3.1 Flash-Lite

production default の変更前に、同じ task を両方で走らせます。同じ prompt、inputs、retrieval pack、tools、timeout、token budget、validator を使います。model ID、price mode、latency、retries、input tokens、output tokens、tool failures、schema failures、reviewer minutes、accepted result を記録します。

Gemini 3.5 Flash は total workflow cost を下げるか accepted quality を大きく改善した時だけ昇格します。Flash-Lite は task が正しく、安く、検証しやすい限り維持します。2回の real workload eval が通るまで両 route を残します。

Adjacent Gemini decisions

For narrower Gemini follow-ups, use Gemini 3.5 Flash capabilities, Gemini API free tier, Gemini API vs Vertex AI, Flash-family runtime guide. 2026年5月21日に、Google AI model pages、Gemini API pricing、changelog、deprecations、Google launch post を確認しました。 Pricing, free-tier access, model availability, and preview shutdown dates can change, so recheck the live official pages before changing production defaults.

よくある質問

Gemini 3.5 Flash は必ず上位ですか?

いいえ。complex agent and coding work では強い first test ですが、simple high-volume work では Flash-Lite が production default として優れることがあります。

両方 stable ですか?

2026年5月21日の official model snapshot では、gemini-3.5-flashgemini-3.1-flash-lite はどちらも stable です。

Flash-Lite preview は使うべきですか?

production では stable gemini-3.1-flash-lite を使います。Google deprecations page は gemini-3.1-flash-lite-preview の shutdown を 2026年5月25日としています。

どちらが安いですか?

May 21 snapshot の paid Standard と Batch/Flex では Flash-Lite が安いです。hard numbers を出す前に official pricing page を再確認してください。

両方を router に残すべきですか?

はい。quality route と margin route を残し、model branding ではなく task class で route します。

Share:

laozhang.ai

One API, All AI Models

AI Image

Gemini 3 Pro Image

$0.05/img
80% OFF
AI Video

Sora 2 · Veo 3.1

$0.15/video
Async API
AI Chat

GPT · Claude · Gemini

200+ models
Official Price
Served 100K+ developers
|@laozhang_cn|Get $0.1