最安の LLM API プロバイダー：価格、品質、遅延、Gateway リスクで選ぶ

AI Free API Team

•2026年7月1日•21 分で読めます•API ガイド

DeepSeek V4 Flash は今回確認した公式有料 token floor では最安ですが、実務で最も安い LLM API provider は出力長、cache、retry、latency、quota、gateway fee、support owner で変わります。

最安の LLM API プロバイダー：価格、品質、遅延、Gateway リスクで選ぶ

最安の LLM API provider は固定の一社ではありません。2026-07-01 時点で確認した範囲では、DeepSeek V4 Flash が最も低い公式有料 token floor です。しかし、本番で一番安いかどうかは別問題です。出力の長さ、cache hit、品質基準、retry、latency、quota、gateway fee、data boundary、support owner、移行工数まで含めて初めて判断できます。

まず route を分けます。公式 direct API は model vendor が価格行、課金単位、lifecycle notice、support contract を持ちます。gateway や aggregator は OpenAI-compatible な移行、多モデル routing、ログ、fallback、support 窓口をまとめられるため、実務では安くなることがあります。無料 route は prompt 実験と prototype 用です。BYOK や self-hosting は、運用能力と利用率が高い場合だけ安くなります。

Route	最初に試すこと	安くなる理由	Stop rule
公式 direct API	DeepSeek V4 Flash で公式有料 token floor を確認し、Gemini 2.5 Flash-Lite Batch/Flex で低コスト batch を試す	vendor-owned price と直接の lifecycle 情報がある	品質、地域、quota、lifecycle が workload に合わなければ止める。
Gateway / aggregator	OpenRouter、SiliconFlow、laozhang.ai は live model/API verification の後に比較する	一つの compatible API、model switching、logs、support consolidation が移行工数を下げる	fee、failed-call billing、support owner、quota、data policy が不明なら止める。
無料 experiment route	free model、trial credit、sandbox quota	prototype と same-prompt 比較に使える	rate limit、terms、availability、support を確認するまで本番には使わない。
BYOK / self-hosted	自分の key、自分の cloud、自分の inference stack	data path と長期 unit economics を制御できる	ops、monitoring、GPU utilization、latency が節約を消すなら止める。

短い式は、effective cost = total bill / accepted outputs です。同じ prompt を走らせ、最新の billable unit を確認し、failure と retry を記録し、spend cap の下で小さく rollout するまで、本番 traffic は切り替えません。

現在の低コスト公式価格ルート

公式価格は最も安全な anchor です。価格行の owner が model vendor で、billing unit、lifecycle、support boundary が読みやすいからです。ただし公式価格だけでは不十分です。input token が安くても、出力が長い、schema failure が多い、retry が多い、fallback が必要、という workload では高くなります。

2026-07-01 に確認した行は次の通りです。DeepSeek V4 Flash は cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input はさらに低い。Gemini 2.5 Flash-Lite は input $0.10、output $0.40、Batch/Flex は $0.05/$0.20。OpenAI gpt-5.4-nano は input $0.20、output $1.25。Mistral Small 4 は $0.15/$0.60。Claude Haiku 4.5 は $1/$5 です。これらは候補を選ぶための事実であり、購入結論ではありません。

公式 route	現在の低コスト行	意味	Boundary
DeepSeek direct	DeepSeek V4 Flash：cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input は大幅に低い	今回確認した公式有料 token floor	code、reasoning、region、reliability の全用途で最適とは限らない。deepseek-chat と deepseek-reasoner の compatibility name は 2026-07-24 15:59 UTC に deprecation 予定。
Google Gemini API	Gemini 2.5 Flash-Lite：input $0.10、output $0.40、Batch/Flex は $0.05/$0.20	latency を許容できる batch-like workload に強い	古い Gemini 2.0 Flash-Lite の価格を現在の助言として使わない。
OpenAI API	gpt-5.4-nano：input $0.20、output $1.25、Batch/Flex は低い	OpenAI-native stack では compatibility と tooling が移行リスクを下げる	最安 floor ではないが、engineering と reliability cost を減らす可能性がある。
Mistral API	Mistral Small 4：input $0.15、output $0.60	open-model route と欧州 governance の文脈で有力	governance、latency、quality を同時に見る。
Anthropic API	Claude Haiku 4.5：input $1、output $5、Sonnet 5 introductory pricing は 2026-08-31 まで	raw token は高いが、review や retry を減らす task では候補	日付付き pricing は cutoff 前に再確認する。

実務上の読み方は、「DeepSeek V4 Flash を安い有料 route の最初の test にする。ただし workload がその output を受理するかを証明する」です。安い model が rejected output を増やすなら、価格表は本当のコストを隠しています。

公式 vendor 価格と gateway/provider 価格を分ける source-owner ボード

Gateway と Provider ルート

Gateway と aggregator は provider route です。API compatibility、model breadth、logs、routing、support consolidation が platform fee より大きく効くとき、実務では安くなります。一方で、second contract boundary、region difference、failed-call billing、provider-owned price row というリスクもあります。

Provider route	確認すること	有用な場面	書いてはいけないこと
OpenRouter	model row、provider route、tokenizer difference、free model limits、Pay-as-you-go 5.5% platform fee	広い catalog、minimum なしの test、pricing-low-to-high sort がある Models API	OpenRouter metadata を OpenAI、Google、Anthropic、DeepSeek、Mistral の公式価格として扱わない。
SiliconFlow	provider-owned price、model version、region、terms、availability	DeepSeek-family provider route を payment、region、operations の都合で使いたいとき	SiliconFlow の DeepSeek row を DeepSeek direct pricing と同一視しない。
laozhang.ai	current model list、feature flags、exact row、billing mode、logs、support path、console/API data	OpenAI-compatible migration、model switching、usage visibility、support owner consolidation が必要なとき	最新 Models API または console で確認せず exact per-model price を公開しない。

laozhang.ai は条件付き候補です。gateway access、OpenAI-compatible 移行、multi-model coverage check、usage logs、support owner をまとめたい場合に比較へ入ります。vendor-owned price、official lifecycle、direct support が必要な場合は公式 API を優先します。公開 documentation が示す pay-as-you-go API integration と OpenAI-compatible Models API は verification route であり、古い価格を固定する根拠ではありません。

Accepted-Output Cost を計算する

実際に最安なのは、品質基準を満たす accepted output あたりのコストが最も低い provider です。raw input price だけでは、bill を動かす要因の多くが見えません。

低価格 LLM API provider を比較する accepted-output cost formula

accepted-output cost = sample run の total bill / acceptance bar を通過した output 数。

Variable	Winner が変わる理由	測るもの
Input tokens	system prompt、tool schema、retrieval chunk、history が短い task でも大きな cost になる	accepted task あたりの平均 billable input
Output tokens	ある model は review を通すために長い説明が必要	accepted output の平均長
Cache hit rate	prompt-heavy workflow は cached input で winner が変わる	cacheable prefix share と hit percentage
Retry rate	timeout、schema failure、weak reasoning、refusal が billable attempts を増やす	accepted answer あたり attempts
Quality threshold	高い bar は安い output を多く reject する	labeled sample の acceptance rate
Latency and quota	rate limit は高い fallback や batch delay を生む	P95 latency、TPM/RPM headroom、fallback share
Gateway fee	platform fee、markup、failed-call billing、minimum spend が invoice を変える	provider invoice / accepted outputs

例として、Provider A は 1000 candidate outputs に $0.20 しか使わないが、600 しか通過しないなら $0.000333 per accepted output です。Provider B は $0.25 かかるが 900 が通過するなら $0.000278 です。表では B が高く、product では B が安い。この差を見ない比較は、本番では危険です。

無料、Trial、BYOK、Self-Hosted

無料 access は便利ですが、本番価格ではありません。trial、quota-limited gateway model、education sandbox、temporary promotion のどれかであることが多いです。無料 route は same-prompt test に evidence を与えるもので、本番 due diligence を置き換えるものではありません。

Lane	向いていること	Hidden cost	Production boundary
gateway の free model	prototype、demo、prompt comparison	strict limits、lower priority、route change、fallback	terms、rate limits、uptime を確認するまで依存しない。
vendor trial credit	新しい official API の比較	expiration、account limits、regional availability	launch math 前に paid row へ切り替える。
BYOK through gateway	vendor account を保ちつつ router を使う	gateway fee、key management、support split、data path	failure owner が vendor か gateway かを明確にする。
self-hosted open model	data control と high-utilization workload	GPU utilization、monitoring、quantization quality、maintenance	utilization が高く quality が足りるときだけ安い。

日本語読者が provider を比較するときは、「無料で使えるか」と「本番で安いか」を分けます。無料 route は検証 evidence を作るために使う。本番 route は predictable billing、logs、fallback、support owner があるものだけにします。

切り替え前の検証ワークフロー

価格表だけで本番 traffic を移行しません。価格表は candidate を選ぶために使い、live route を検証します。

LLM API provider traffic を切り替える前の verification workflow と production stop rules

公式 model-vendor pricing page で direct API row、billing unit、date を確認する。
gateway を使うなら、provider price を引用する前に current model/API metadata または console を確認する。
各 candidate route に同じ prompt set を走らせる。
input tokens、output tokens、cache behavior、failures、retries、latency、accepted outputs を記録する。
total bill / accepted outputs で比較する。
failed-call billing、quota、logs、support owner、data retention、regional terms を確認する。
spend cap、quality fallback、rollback path の下で小さい traffic slice だけ動かす。

failed-call billing が不明、latency に concurrency 余裕がない、model name が lifecycle change に近い、usage logs が budget control に足りない、data retention が workload と衝突する、upstream failure の owner を provider が説明できないなら止めます。monitoring できない cheap route は、本番には安くありません。

Workload 別の最初の Test

以下は調達結論ではなく、第一 round の test route です。

Workload	First route to test	Backup route	Why
cheap chat、extraction、light summarization	DeepSeek V4 Flash direct	Gemini 2.5 Flash-Lite または OpenAI gpt-5.4-nano	official paid floor から始め、acceptance rate と output length を見る。
large asynchronous summarization	Gemini 2.5 Flash-Lite Batch/Flex	OpenAI Batch/Flex low-cost rows	latency が urgent でなければ batch lane が安くなる。
OpenAI-compatible migration with many candidate models	OpenRouter または laozhang.ai、live verification 後	winning model の official direct API	gateway convenience は fee と source-owner check 後に評価する。
DeepSeek-family provider route	DeepSeek direct first、必要なら SiliconFlow	verified metadata を持つ別 gateway	provider-owned DeepSeek row は provider label と current verification が必要。
coding or agentic tasks	DeepSeek、OpenAI、Claude、gateway fallback の same-prompt test	lowest accepted-output cost の model	retry rate と tool reliability が raw token price を上回ることがある。
governance-sensitive workload	Mistral または required region/data terms を満たす direct route	realistic な BYOK/self-hosting	compliance と data owner は追加 cost に値する場合がある。

一つの product が複数 provider を使うことも自然です。classifier は cheap official row、coding assistant は strong model、gateway は fallback routing だけを担当する。すべてを一社に寄せるほど高くなる場合があります。

Provider Checklist

「最安」と言う前に、次を文書化します。価格行の owner は model vendor、gateway、cloud platform、reseller、または自社 infrastructure team のどれか。row は input-only、output-only、cached input、batch/flex、per request、per second、tool-call のどれか。対象 model version、region、lifecycle status は何か。failed calls、timeouts、safety refusals、retries はどう課金されるか。RPM、TPM、daily quota、spend-limit behavior はどう動くか。logs、usage export、alerting は budget control に足りるか。upstream model failure の support owner は誰か。data retention、training、regional terms は task に合うか。same-prompt set は chosen quality bar を通過するか。rollout は failure 時に open-ended bill を作らない cap を持つか。

この checklist は price table より厳しいです。なぜなら、価格を deployable cost に変えるためのものだからです。model name、platform fee、free-route rule が変わったときにも、team が戻れる audit trail になります。

よくある質問

今いちばん安い LLM API provider はどこですか？

2026-07-01 に確認した公式有料 token floor では、DeepSeek V4 Flash がこの比較で最も低い行です。ただし、すべての workload で最安とは限りません。output length、cache rate、retries、latency、quota、gateway fee、support owner を含めて accepted-output cost を比較します。

OpenRouter は direct API より安いですか？

場合によります。OpenRouter は integration work を減らし、ひとつの gateway で多くの model を出せますが、Pay-as-you-go には platform fee があり、価格は選ぶ route に依存します。gateway-owned metadata として扱い、本番前に live row を確認します。

laozhang.ai を最安 provider として使うべきですか？

laozhang.ai は OpenAI-compatible API migration、model switching、usage visibility、support owner consolidation が job のときに候補になります。current Models API または console row が exact model price を証明しない限り、最安 provider と断言しません。

無料 LLM API は本番に使えますか？

limits、terms、uptime、quota、logs、support path を確認するまでは no と考えます。無料 route は prompt comparison と early prototype に向いています。本番には predictable billing と rollback が必要です。

なぜ低い input price が負けるのですか？

bill は input tokens だけではありません。long outputs、低 cache hit、schema failure、retry、strict review、latency fallback、gateway fee が accepted-output cost を押し上げます。

価格はどれくらいの頻度で再確認すべきですか？

本番移行前、大きな volume increase の前、model lifecycle note、platform fee、free-route term が変わったときに再確認します。日付付きの価格は cutoff 前に予定として確認します。

結論

公式 token floor は first candidate を選ぶために使います。最終 provider を決めるものではありません。DeepSeek V4 Flash は多くの text workload で最初に試す価値があります。Gemini 2.5 Flash-Lite Batch/Flex は asynchronous scale で試す価値があります。OpenAI、Anthropic、Mistral は compatibility、quality、governance、reliability によって rejected output を減らす場合に勝ちます。OpenRouter、SiliconFlow、laozhang.ai のような gateway は routing、logs、API compatibility、support consolidation が provider fee を上回るときに勝ちます。最後は current row を確認し、same prompt を走らせ、full bill を accepted outputs で割り、cap の下で rollout します。

現在の低コスト公式価格ルート

Gateway と Provider ルート

Accepted-Output Cost を計算する

accepted-output cost = sample run の total bill / acceptance bar を通過した output 数。

無料、Trial、BYOK、Self-Hosted

切り替え前の検証ワークフロー

価格表だけで本番 traffic を移行しません。価格表は candidate を選ぶために使い、live route を検証します。

1. 公式 model-vendor pricing page で direct API row、billing unit、date を確認する。 2. gateway を使うなら、provider price を引用する前に current model/API metadata または console を確認する。 3. 各 candidate route に同じ prompt set を走らせる。 4. input tokens、output tokens、cache behavior、failures、retries、latency、accepted outputs を記録する。 5. total bill / accepted outputs で比較する。 6. failed-call billing、quota、logs、support owner、data retention、regional terms を確認する。 7. spend cap、quality fallback、rollback path の下で小さい traffic slice だけ動かす。

Workload 別の最初の Test

以下は調達結論ではなく、第一 round の test route です。

Provider Checklist

よくある質問

今いちばん安い LLM API provider はどこですか？

OpenRouter は direct API より安いですか？

laozhang.ai を最安 provider として使うべきですか？

無料 LLM API は本番に使えますか？

なぜ低い input price が負けるのですか？

価格はどれくらいの頻度で再確認すべきですか？

結論

#LLM API#API 価格#AI API Provider#Gateway#開発者ガイド