最安の LLM API provider は固定の一社ではありません。2026-07-01 時点で確認した範囲では、DeepSeek V4 Flash が最も低い公式有料 token floor です。しかし、本番で一番安いかどうかは別問題です。出力の長さ、cache hit、品質基準、retry、latency、quota、gateway fee、data boundary、support owner、移行工数まで含めて初めて判断できます。
まず route を分けます。公式 direct API は model vendor が価格行、課金単位、lifecycle notice、support contract を持ちます。gateway や aggregator は OpenAI-compatible な移行、多モデル routing、ログ、fallback、support 窓口をまとめられるため、実務では安くなることがあります。無料 route は prompt 実験と prototype 用です。BYOK や self-hosting は、運用能力と利用率が高い場合だけ安くなります。
| Route | 最初に試すこと | 安くなる理由 | Stop rule |
|---|---|---|---|
| 公式 direct API | DeepSeek V4 Flash で公式有料 token floor を確認し、Gemini 2.5 Flash-Lite Batch/Flex で低コスト batch を試す | vendor-owned price と直接の lifecycle 情報がある | 品質、地域、quota、lifecycle が workload に合わなければ止める。 |
| Gateway / aggregator | OpenRouter、SiliconFlow、laozhang.ai は live model/API verification の後に比較する | 一つの compatible API、model switching、logs、support consolidation が移行工数を下げる | fee、failed-call billing、support owner、quota、data policy が不明なら止める。 |
| 無料 experiment route | free model、trial credit、sandbox quota | prototype と same-prompt 比較に使える | rate limit、terms、availability、support を確認するまで本番には使わない。 |
| BYOK / self-hosted | 自分の key、自分の cloud、自分の inference stack | data path と長期 unit economics を制御できる | ops、monitoring、GPU utilization、latency が節約を消すなら止める。 |
短い式は、effective cost = total bill / accepted outputs です。同じ prompt を走らせ、最新の billable unit を確認し、failure と retry を記録し、spend cap の下で小さく rollout するまで、本番 traffic は切り替えません。
現在の低コスト公式価格ルート
公式価格は最も安全な anchor です。価格行の owner が model vendor で、billing unit、lifecycle、support boundary が読みやすいからです。ただし公式価格だけでは不十分です。input token が安くても、出力が長い、schema failure が多い、retry が多い、fallback が必要、という workload では高くなります。
2026-07-01 に確認した行は次の通りです。DeepSeek V4 Flash は cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input はさらに低い。Gemini 2.5 Flash-Lite は input $0.10、output $0.40、Batch/Flex は $0.05/$0.20。OpenAI gpt-5.4-nano は input $0.20、output $1.25。Mistral Small 4 は $0.15/$0.60。Claude Haiku 4.5 は $1/$5 です。これらは候補を選ぶための事実であり、購入結論ではありません。
| 公式 route | 現在の低コスト行 | 意味 | Boundary |
|---|---|---|---|
| DeepSeek direct | DeepSeek V4 Flash:cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input は大幅に低い | 今回確認した公式有料 token floor | code、reasoning、region、reliability の全用途で最適とは限らない。deepseek-chat と deepseek-reasoner の compatibility name は 2026-07-24 15:59 UTC に deprecation 予定。 |
| Google Gemini API | Gemini 2.5 Flash-Lite:input $0.10、output $0.40、Batch/Flex は $0.05/$0.20 | latency を許容できる batch-like workload に強い | 古い Gemini 2.0 Flash-Lite の価格を現在の助言として使わない。 |
| OpenAI API | gpt-5.4-nano:input $0.20、output $1.25、Batch/Flex は低い | OpenAI-native stack では compatibility と tooling が移行リスクを下げる | 最安 floor ではないが、engineering と reliability cost を減らす可能性がある。 |
| Mistral API | Mistral Small 4:input $0.15、output $0.60 | open-model route と欧州 governance の文脈で有力 | governance、latency、quality を同時に見る。 |
| Anthropic API | Claude Haiku 4.5:input $1、output $5、Sonnet 5 introductory pricing は 2026-08-31 まで | raw token は高いが、review や retry を減らす task では候補 | 日付付き pricing は cutoff 前に再確認する。 |
実務上の読み方は、「DeepSeek V4 Flash を安い有料 route の最初の test にする。ただし workload がその output を受理するかを証明する」です。安い model が rejected output を増やすなら、価格表は本当のコストを隠しています。

Gateway と Provider ルート
Gateway と aggregator は provider route です。API compatibility、model breadth、logs、routing、support consolidation が platform fee より大きく効くとき、実務では安くなります。一方で、second contract boundary、region difference、failed-call billing、provider-owned price row というリスクもあります。
| Provider route | 確認すること | 有用な場面 | 書いてはいけないこと |
|---|---|---|---|
| OpenRouter | model row、provider route、tokenizer difference、free model limits、Pay-as-you-go 5.5% platform fee | 広い catalog、minimum なしの test、pricing-low-to-high sort がある Models API | OpenRouter metadata を OpenAI、Google、Anthropic、DeepSeek、Mistral の公式価格として扱わない。 |
| SiliconFlow | provider-owned price、model version、region、terms、availability | DeepSeek-family provider route を payment、region、operations の都合で使いたいとき | SiliconFlow の DeepSeek row を DeepSeek direct pricing と同一視しない。 |
| laozhang.ai | current model list、feature flags、exact row、billing mode、logs、support path、console/API data | OpenAI-compatible migration、model switching、usage visibility、support owner consolidation が必要なとき | 最新 Models API または console で確認せず exact per-model price を公開しない。 |
laozhang.ai は条件付き候補です。gateway access、OpenAI-compatible 移行、multi-model coverage check、usage logs、support owner をまとめたい場合に比較へ入ります。vendor-owned price、official lifecycle、direct support が必要な場合は公式 API を優先します。公開 documentation が示す pay-as-you-go API integration と OpenAI-compatible Models API は verification route であり、古い価格を固定する根拠ではありません。
Accepted-Output Cost を計算する
実際に最安なのは、品質基準を満たす accepted output あたりのコストが最も低い provider です。raw input price だけでは、bill を動かす要因の多くが見えません。

accepted-output cost = sample run の total bill / acceptance bar を通過した output 数。
| Variable | Winner が変わる理由 | 測るもの |
|---|---|---|
| Input tokens | system prompt、tool schema、retrieval chunk、history が短い task でも大きな cost になる | accepted task あたりの平均 billable input |
| Output tokens | ある model は review を通すために長い説明が必要 | accepted output の平均長 |
| Cache hit rate | prompt-heavy workflow は cached input で winner が変わる | cacheable prefix share と hit percentage |
| Retry rate | timeout、schema failure、weak reasoning、refusal が billable attempts を増やす | accepted answer あたり attempts |
| Quality threshold | 高い bar は安い output を多く reject する | labeled sample の acceptance rate |
| Latency and quota | rate limit は高い fallback や batch delay を生む | P95 latency、TPM/RPM headroom、fallback share |
| Gateway fee | platform fee、markup、failed-call billing、minimum spend が invoice を変える | provider invoice / accepted outputs |
例として、Provider A は 1000 candidate outputs に $0.20 しか使わないが、600 しか通過しないなら $0.000333 per accepted output です。Provider B は $0.25 かかるが 900 が通過するなら $0.000278 です。表では B が高く、product では B が安い。この差を見ない比較は、本番では危険です。
無料、Trial、BYOK、Self-Hosted
無料 access は便利ですが、本番価格ではありません。trial、quota-limited gateway model、education sandbox、temporary promotion のどれかであることが多いです。無料 route は same-prompt test に evidence を与えるもので、本番 due diligence を置き換えるものではありません。
| Lane | 向いていること | Hidden cost | Production boundary |
|---|---|---|---|
| gateway の free model | prototype、demo、prompt comparison | strict limits、lower priority、route change、fallback | terms、rate limits、uptime を確認するまで依存しない。 |
| vendor trial credit | 新しい official API の比較 | expiration、account limits、regional availability | launch math 前に paid row へ切り替える。 |
| BYOK through gateway | vendor account を保ちつつ router を使う | gateway fee、key management、support split、data path | failure owner が vendor か gateway かを明確にする。 |
| self-hosted open model | data control と high-utilization workload | GPU utilization、monitoring、quantization quality、maintenance | utilization が高く quality が足りるときだけ安い。 |
日本語読者が provider を比較するときは、「無料で使えるか」と「本番で安いか」を分けます。無料 route は検証 evidence を作るために使う。本番 route は predictable billing、logs、fallback、support owner があるものだけにします。
切り替え前の検証ワークフロー
価格表だけで本番 traffic を移行しません。価格表は candidate を選ぶために使い、live route を検証します。

- 公式 model-vendor pricing page で direct API row、billing unit、date を確認する。
- gateway を使うなら、provider price を引用する前に current model/API metadata または console を確認する。
- 各 candidate route に同じ prompt set を走らせる。
- input tokens、output tokens、cache behavior、failures、retries、latency、accepted outputs を記録する。
- total bill / accepted outputs で比較する。
- failed-call billing、quota、logs、support owner、data retention、regional terms を確認する。
- spend cap、quality fallback、rollback path の下で小さい traffic slice だけ動かす。
failed-call billing が不明、latency に concurrency 余裕がない、model name が lifecycle change に近い、usage logs が budget control に足りない、data retention が workload と衝突する、upstream failure の owner を provider が説明できないなら止めます。monitoring できない cheap route は、本番には安くありません。
Workload 別の最初の Test
以下は調達結論ではなく、第一 round の test route です。
| Workload | First route to test | Backup route | Why |
|---|---|---|---|
| cheap chat、extraction、light summarization | DeepSeek V4 Flash direct | Gemini 2.5 Flash-Lite または OpenAI gpt-5.4-nano | official paid floor から始め、acceptance rate と output length を見る。 |
| large asynchronous summarization | Gemini 2.5 Flash-Lite Batch/Flex | OpenAI Batch/Flex low-cost rows | latency が urgent でなければ batch lane が安くなる。 |
| OpenAI-compatible migration with many candidate models | OpenRouter または laozhang.ai、live verification 後 | winning model の official direct API | gateway convenience は fee と source-owner check 後に評価する。 |
| DeepSeek-family provider route | DeepSeek direct first、必要なら SiliconFlow | verified metadata を持つ別 gateway | provider-owned DeepSeek row は provider label と current verification が必要。 |
| coding or agentic tasks | DeepSeek、OpenAI、Claude、gateway fallback の same-prompt test | lowest accepted-output cost の model | retry rate と tool reliability が raw token price を上回ることがある。 |
| governance-sensitive workload | Mistral または required region/data terms を満たす direct route | realistic な BYOK/self-hosting | compliance と data owner は追加 cost に値する場合がある。 |
一つの product が複数 provider を使うことも自然です。classifier は cheap official row、coding assistant は strong model、gateway は fallback routing だけを担当する。すべてを一社に寄せるほど高くなる場合があります。
Provider Checklist
「最安」と言う前に、次を文書化します。価格行の owner は model vendor、gateway、cloud platform、reseller、または自社 infrastructure team のどれか。row は input-only、output-only、cached input、batch/flex、per request、per second、tool-call のどれか。対象 model version、region、lifecycle status は何か。failed calls、timeouts、safety refusals、retries はどう課金されるか。RPM、TPM、daily quota、spend-limit behavior はどう動くか。logs、usage export、alerting は budget control に足りるか。upstream model failure の support owner は誰か。data retention、training、regional terms は task に合うか。same-prompt set は chosen quality bar を通過するか。rollout は failure 時に open-ended bill を作らない cap を持つか。
この checklist は price table より厳しいです。なぜなら、価格を deployable cost に変えるためのものだからです。model name、platform fee、free-route rule が変わったときにも、team が戻れる audit trail になります。
よくある質問
今いちばん安い LLM API provider はどこですか?
2026-07-01 に確認した公式有料 token floor では、DeepSeek V4 Flash がこの比較で最も低い行です。ただし、すべての workload で最安とは限りません。output length、cache rate、retries、latency、quota、gateway fee、support owner を含めて accepted-output cost を比較します。
OpenRouter は direct API より安いですか?
場合によります。OpenRouter は integration work を減らし、ひとつの gateway で多くの model を出せますが、Pay-as-you-go には platform fee があり、価格は選ぶ route に依存します。gateway-owned metadata として扱い、本番前に live row を確認します。
laozhang.ai を最安 provider として使うべきですか?
laozhang.ai は OpenAI-compatible API migration、model switching、usage visibility、support owner consolidation が job のときに候補になります。current Models API または console row が exact model price を証明しない限り、最安 provider と断言しません。
無料 LLM API は本番に使えますか?
limits、terms、uptime、quota、logs、support path を確認するまでは no と考えます。無料 route は prompt comparison と early prototype に向いています。本番には predictable billing と rollback が必要です。
なぜ低い input price が負けるのですか?
bill は input tokens だけではありません。long outputs、低 cache hit、schema failure、retry、strict review、latency fallback、gateway fee が accepted-output cost を押し上げます。
価格はどれくらいの頻度で再確認すべきですか?
本番移行前、大きな volume increase の前、model lifecycle note、platform fee、free-route term が変わったときに再確認します。日付付きの価格は cutoff 前に予定として確認します。
結論
公式 token floor は first candidate を選ぶために使います。最終 provider を決めるものではありません。DeepSeek V4 Flash は多くの text workload で最初に試す価値があります。Gemini 2.5 Flash-Lite Batch/Flex は asynchronous scale で試す価値があります。OpenAI、Anthropic、Mistral は compatibility、quality、governance、reliability によって rejected output を減らす場合に勝ちます。OpenRouter、SiliconFlow、laozhang.ai のような gateway は routing、logs、API compatibility、support consolidation が provider fee を上回るときに勝ちます。最後は current row を確認し、same prompt を走らせ、full bill を accepted outputs で割り、cap の下で rollout します。
