メインコンテンツへスキップ

最安の LLM API プロバイダー:価格、品質、遅延、Gateway リスクで選ぶ

A
21 分で読めますAPI ガイド

DeepSeek V4 Flash は今回確認した公式有料 token floor では最安ですが、実務で最も安い LLM API provider は出力長、cache、retry、latency、quota、gateway fee、support owner で変わります。

最安の LLM API プロバイダー:価格、品質、遅延、Gateway リスクで選ぶ

最安の LLM API provider は固定の一社ではありません。2026-07-01 時点で確認した範囲では、DeepSeek V4 Flash が最も低い公式有料 token floor です。しかし、本番で一番安いかどうかは別問題です。出力の長さ、cache hit、品質基準、retry、latency、quota、gateway fee、data boundary、support owner、移行工数まで含めて初めて判断できます。

まず route を分けます。公式 direct API は model vendor が価格行、課金単位、lifecycle notice、support contract を持ちます。gateway や aggregator は OpenAI-compatible な移行、多モデル routing、ログ、fallback、support 窓口をまとめられるため、実務では安くなることがあります。無料 route は prompt 実験と prototype 用です。BYOK や self-hosting は、運用能力と利用率が高い場合だけ安くなります。

Route最初に試すこと安くなる理由Stop rule
公式 direct APIDeepSeek V4 Flash で公式有料 token floor を確認し、Gemini 2.5 Flash-Lite Batch/Flex で低コスト batch を試すvendor-owned price と直接の lifecycle 情報がある品質、地域、quota、lifecycle が workload に合わなければ止める。
Gateway / aggregatorOpenRouter、SiliconFlow、laozhang.ai は live model/API verification の後に比較する一つの compatible API、model switching、logs、support consolidation が移行工数を下げるfee、failed-call billing、support owner、quota、data policy が不明なら止める。
無料 experiment routefree model、trial credit、sandbox quotaprototype と same-prompt 比較に使えるrate limit、terms、availability、support を確認するまで本番には使わない。
BYOK / self-hosted自分の key、自分の cloud、自分の inference stackdata path と長期 unit economics を制御できるops、monitoring、GPU utilization、latency が節約を消すなら止める。

短い式は、effective cost = total bill / accepted outputs です。同じ prompt を走らせ、最新の billable unit を確認し、failure と retry を記録し、spend cap の下で小さく rollout するまで、本番 traffic は切り替えません。

現在の低コスト公式価格ルート

公式価格は最も安全な anchor です。価格行の owner が model vendor で、billing unit、lifecycle、support boundary が読みやすいからです。ただし公式価格だけでは不十分です。input token が安くても、出力が長い、schema failure が多い、retry が多い、fallback が必要、という workload では高くなります。

2026-07-01 に確認した行は次の通りです。DeepSeek V4 Flash は cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input はさらに低い。Gemini 2.5 Flash-Lite は input $0.10、output $0.40、Batch/Flex は $0.05/$0.20。OpenAI gpt-5.4-nano は input $0.20、output $1.25。Mistral Small 4 は $0.15/$0.60。Claude Haiku 4.5 は $1/$5 です。これらは候補を選ぶための事実であり、購入結論ではありません。

公式 route現在の低コスト行意味Boundary
DeepSeek directDeepSeek V4 Flash:cache-miss input $0.14、output $0.28 / 1M tokens、cache-hit input は大幅に低い今回確認した公式有料 token floorcode、reasoning、region、reliability の全用途で最適とは限らない。deepseek-chat と deepseek-reasoner の compatibility name は 2026-07-24 15:59 UTC に deprecation 予定。
Google Gemini APIGemini 2.5 Flash-Lite:input $0.10、output $0.40、Batch/Flex は $0.05/$0.20latency を許容できる batch-like workload に強い古い Gemini 2.0 Flash-Lite の価格を現在の助言として使わない。
OpenAI APIgpt-5.4-nano:input $0.20、output $1.25、Batch/Flex は低いOpenAI-native stack では compatibility と tooling が移行リスクを下げる最安 floor ではないが、engineering と reliability cost を減らす可能性がある。
Mistral APIMistral Small 4:input $0.15、output $0.60open-model route と欧州 governance の文脈で有力governance、latency、quality を同時に見る。
Anthropic APIClaude Haiku 4.5:input $1、output $5、Sonnet 5 introductory pricing は 2026-08-31 までraw token は高いが、review や retry を減らす task では候補日付付き pricing は cutoff 前に再確認する。

実務上の読み方は、「DeepSeek V4 Flash を安い有料 route の最初の test にする。ただし workload がその output を受理するかを証明する」です。安い model が rejected output を増やすなら、価格表は本当のコストを隠しています。

公式 vendor 価格と gateway/provider 価格を分ける source-owner ボード

Gateway と Provider ルート

Gateway と aggregator は provider route です。API compatibility、model breadth、logs、routing、support consolidation が platform fee より大きく効くとき、実務では安くなります。一方で、second contract boundary、region difference、failed-call billing、provider-owned price row というリスクもあります。

Provider route確認すること有用な場面書いてはいけないこと
OpenRoutermodel row、provider route、tokenizer difference、free model limits、Pay-as-you-go 5.5% platform fee広い catalog、minimum なしの test、pricing-low-to-high sort がある Models APIOpenRouter metadata を OpenAI、Google、Anthropic、DeepSeek、Mistral の公式価格として扱わない。
SiliconFlowprovider-owned price、model version、region、terms、availabilityDeepSeek-family provider route を payment、region、operations の都合で使いたいときSiliconFlow の DeepSeek row を DeepSeek direct pricing と同一視しない。
laozhang.aicurrent model list、feature flags、exact row、billing mode、logs、support path、console/API dataOpenAI-compatible migration、model switching、usage visibility、support owner consolidation が必要なとき最新 Models API または console で確認せず exact per-model price を公開しない。

laozhang.ai は条件付き候補です。gateway access、OpenAI-compatible 移行、multi-model coverage check、usage logs、support owner をまとめたい場合に比較へ入ります。vendor-owned price、official lifecycle、direct support が必要な場合は公式 API を優先します。公開 documentation が示す pay-as-you-go API integration と OpenAI-compatible Models API は verification route であり、古い価格を固定する根拠ではありません。

Accepted-Output Cost を計算する

実際に最安なのは、品質基準を満たす accepted output あたりのコストが最も低い provider です。raw input price だけでは、bill を動かす要因の多くが見えません。

低価格 LLM API provider を比較する accepted-output cost formula

accepted-output cost = sample run の total bill / acceptance bar を通過した output 数。

VariableWinner が変わる理由測るもの
Input tokenssystem prompt、tool schema、retrieval chunk、history が短い task でも大きな cost になるaccepted task あたりの平均 billable input
Output tokensある model は review を通すために長い説明が必要accepted output の平均長
Cache hit rateprompt-heavy workflow は cached input で winner が変わるcacheable prefix share と hit percentage
Retry ratetimeout、schema failure、weak reasoning、refusal が billable attempts を増やすaccepted answer あたり attempts
Quality threshold高い bar は安い output を多く reject するlabeled sample の acceptance rate
Latency and quotarate limit は高い fallback や batch delay を生むP95 latency、TPM/RPM headroom、fallback share
Gateway feeplatform fee、markup、failed-call billing、minimum spend が invoice を変えるprovider invoice / accepted outputs

例として、Provider A は 1000 candidate outputs に $0.20 しか使わないが、600 しか通過しないなら $0.000333 per accepted output です。Provider B は $0.25 かかるが 900 が通過するなら $0.000278 です。表では B が高く、product では B が安い。この差を見ない比較は、本番では危険です。

無料、Trial、BYOK、Self-Hosted

無料 access は便利ですが、本番価格ではありません。trial、quota-limited gateway model、education sandbox、temporary promotion のどれかであることが多いです。無料 route は same-prompt test に evidence を与えるもので、本番 due diligence を置き換えるものではありません。

Lane向いていることHidden costProduction boundary
gateway の free modelprototype、demo、prompt comparisonstrict limits、lower priority、route change、fallbackterms、rate limits、uptime を確認するまで依存しない。
vendor trial credit新しい official API の比較expiration、account limits、regional availabilitylaunch math 前に paid row へ切り替える。
BYOK through gatewayvendor account を保ちつつ router を使うgateway fee、key management、support split、data pathfailure owner が vendor か gateway かを明確にする。
self-hosted open modeldata control と high-utilization workloadGPU utilization、monitoring、quantization quality、maintenanceutilization が高く quality が足りるときだけ安い。

日本語読者が provider を比較するときは、「無料で使えるか」と「本番で安いか」を分けます。無料 route は検証 evidence を作るために使う。本番 route は predictable billing、logs、fallback、support owner があるものだけにします。

切り替え前の検証ワークフロー

価格表だけで本番 traffic を移行しません。価格表は candidate を選ぶために使い、live route を検証します。

LLM API provider traffic を切り替える前の verification workflow と production stop rules

  1. 公式 model-vendor pricing page で direct API row、billing unit、date を確認する。
  2. gateway を使うなら、provider price を引用する前に current model/API metadata または console を確認する。
  3. 各 candidate route に同じ prompt set を走らせる。
  4. input tokens、output tokens、cache behavior、failures、retries、latency、accepted outputs を記録する。
  5. total bill / accepted outputs で比較する。
  6. failed-call billing、quota、logs、support owner、data retention、regional terms を確認する。
  7. spend cap、quality fallback、rollback path の下で小さい traffic slice だけ動かす。

failed-call billing が不明、latency に concurrency 余裕がない、model name が lifecycle change に近い、usage logs が budget control に足りない、data retention が workload と衝突する、upstream failure の owner を provider が説明できないなら止めます。monitoring できない cheap route は、本番には安くありません。

Workload 別の最初の Test

以下は調達結論ではなく、第一 round の test route です。

WorkloadFirst route to testBackup routeWhy
cheap chat、extraction、light summarizationDeepSeek V4 Flash directGemini 2.5 Flash-Lite または OpenAI gpt-5.4-nanoofficial paid floor から始め、acceptance rate と output length を見る。
large asynchronous summarizationGemini 2.5 Flash-Lite Batch/FlexOpenAI Batch/Flex low-cost rowslatency が urgent でなければ batch lane が安くなる。
OpenAI-compatible migration with many candidate modelsOpenRouter または laozhang.ai、live verification 後winning model の official direct APIgateway convenience は fee と source-owner check 後に評価する。
DeepSeek-family provider routeDeepSeek direct first、必要なら SiliconFlowverified metadata を持つ別 gatewayprovider-owned DeepSeek row は provider label と current verification が必要。
coding or agentic tasksDeepSeek、OpenAI、Claude、gateway fallback の same-prompt testlowest accepted-output cost の modelretry rate と tool reliability が raw token price を上回ることがある。
governance-sensitive workloadMistral または required region/data terms を満たす direct routerealistic な BYOK/self-hostingcompliance と data owner は追加 cost に値する場合がある。

一つの product が複数 provider を使うことも自然です。classifier は cheap official row、coding assistant は strong model、gateway は fallback routing だけを担当する。すべてを一社に寄せるほど高くなる場合があります。

Provider Checklist

「最安」と言う前に、次を文書化します。価格行の owner は model vendor、gateway、cloud platform、reseller、または自社 infrastructure team のどれか。row は input-only、output-only、cached input、batch/flex、per request、per second、tool-call のどれか。対象 model version、region、lifecycle status は何か。failed calls、timeouts、safety refusals、retries はどう課金されるか。RPM、TPM、daily quota、spend-limit behavior はどう動くか。logs、usage export、alerting は budget control に足りるか。upstream model failure の support owner は誰か。data retention、training、regional terms は task に合うか。same-prompt set は chosen quality bar を通過するか。rollout は failure 時に open-ended bill を作らない cap を持つか。

この checklist は price table より厳しいです。なぜなら、価格を deployable cost に変えるためのものだからです。model name、platform fee、free-route rule が変わったときにも、team が戻れる audit trail になります。

よくある質問

今いちばん安い LLM API provider はどこですか?

2026-07-01 に確認した公式有料 token floor では、DeepSeek V4 Flash がこの比較で最も低い行です。ただし、すべての workload で最安とは限りません。output length、cache rate、retries、latency、quota、gateway fee、support owner を含めて accepted-output cost を比較します。

OpenRouter は direct API より安いですか?

場合によります。OpenRouter は integration work を減らし、ひとつの gateway で多くの model を出せますが、Pay-as-you-go には platform fee があり、価格は選ぶ route に依存します。gateway-owned metadata として扱い、本番前に live row を確認します。

laozhang.ai を最安 provider として使うべきですか?

laozhang.ai は OpenAI-compatible API migration、model switching、usage visibility、support owner consolidation が job のときに候補になります。current Models API または console row が exact model price を証明しない限り、最安 provider と断言しません。

無料 LLM API は本番に使えますか?

limits、terms、uptime、quota、logs、support path を確認するまでは no と考えます。無料 route は prompt comparison と early prototype に向いています。本番には predictable billing と rollback が必要です。

なぜ低い input price が負けるのですか?

bill は input tokens だけではありません。long outputs、低 cache hit、schema failure、retry、strict review、latency fallback、gateway fee が accepted-output cost を押し上げます。

価格はどれくらいの頻度で再確認すべきですか?

本番移行前、大きな volume increase の前、model lifecycle note、platform fee、free-route term が変わったときに再確認します。日付付きの価格は cutoff 前に予定として確認します。

結論

公式 token floor は first candidate を選ぶために使います。最終 provider を決めるものではありません。DeepSeek V4 Flash は多くの text workload で最初に試す価値があります。Gemini 2.5 Flash-Lite Batch/Flex は asynchronous scale で試す価値があります。OpenAI、Anthropic、Mistral は compatibility、quality、governance、reliability によって rejected output を減らす場合に勝ちます。OpenRouter、SiliconFlow、laozhang.ai のような gateway は routing、logs、API compatibility、support consolidation が provider fee を上回るときに勝ちます。最後は current row を確認し、same prompt を走らせ、full bill を accepted outputs で割り、cap の下で rollout します。

#LLM API#API 価格#AI API Provider#Gateway#開発者ガイド
Share: