2026年5月23日時点で、Codex CLIには誰にでも当てはまる1日のtoken数はありません。まず確認すべきなのは、いまのセッションがChatGPTログイン、API key、Codexのクラウドタスク、code review、fast modeのどれで動いているかです。API-key課金が有効なときだけ、input tokens、cached input tokens、output tokensを分けてAPI支出を計算します。長い実行の前には、ルート、計算式、日次上限の順に決めてから始めるのが安全です。
2分で使う見積もり手順
大きなリポジトリ変更、長いデバッグ、複数ファイルの修正、ログを多く読む作業を始める前に、この短い手順で予算の形を作ります。請求額を予言するものではありませんが、続行してよいかを判断できます。
- ルートを確認します。ChatGPTログイン、API key、ローカルCLI、クラウドタスク、code review、fast modeを分けます。
- API-key課金なら、実際のモデルと現在のOpenAI Platform価格を確認します。
- tokenをinput、cached input、outputの3つに分けます。
- それぞれを100万token単価で掛けます。
- その日のソフト上限とハード上限を書いてから、長い実行を始めます。
API-keyルートの式は次の通りです。
text1日のAPIコスト = input_tokens / 1,000,000 * input_price + cached_input_tokens / 1,000,000 * cached_input_price + output_tokens / 1,000,000 * output_price
2026年5月23日に確認したOpenAIの標準テキスト価格では、3M input、2M cached input、0.4M outputの普通の日は、gpt-5.4-miniで約4.20ドル、gpt-5.4で約14.00ドルです。これは請求の保証ではなく、前提を見える化した予算の練習です。
どの課金ルートが動いているか

高い請求の多くは、計算式ではなくルートの取り違えから始まります。端末では同じCodexに見えても、背後のメーターが違うことがあります。
| ルート | 意味 | 見積もりに使うもの | 確認場所 |
|---|---|---|---|
| ChatGPTログイン | ChatGPTプラン内のCodex利用 | included usage、credits、アカウント上限 | Codex Settings、/status |
| API-key課金 | OpenAI Platform経由のローカルCLIや自動化 | input、cached input、outputの価格 | OpenAI Platform Usage |
| クラウドタスク/code review | ホストされたCodex作業 | タスク詳細とCodex pricing | Task summary、Codex Settings |
| fast mode | ChatGPTルートで速く動くがcredits消費も速い | creditsと現在の倍率 | Codex Settings、speed docs |
Codex authenticationでは、API-key sign-inはOpenAI Platform billingで標準API ratesを使うと説明されています。Codex pricingはChatGPTプラン、credits、API-key availabilityを別の文脈で扱います。ChatGPTのincluded usageがAPI-keyの請求を自動で払う、と考えてはいけません。
ルート選択そのものに迷う場合は、先に Codex API Key vs Subscription: Which Route Should You Use? を確認してください。API-keyコストを見積もる場面では、まず課金ルートを確定してから計算に入ります。
現在の価格アンカー
API-keyの見積もりでは、input、cached input、outputを分けます。Codexが長い説明、完全なファイル、テストログ、繰り返しのまとめを書くと、outputが支出を大きくします。
| Model | Input | Cached input | Output | 見積もりでの役割 |
|---|---|---|---|---|
| gpt-5.4-mini | $0.75 / 1M | $0.075 / 1M | $4.50 / 1M | 通常作業の低コスト基準 |
| gpt-5.4 | $2.50 / 1M | $0.25 / 1M | $15.00 / 1M | 重い診断や設計判断の基準 |
| gpt-5.5 | $5.00 / 1M | $0.50 / 1M | $30.00 / 1M | Platform価格はあるが、Codex API-keyの基準にするにはCodex docs側の確認が必要 |
GPT-5.5の扱いは曖昧にしないでください。この実行で確認した時点では、Codex pricingはChatGPT-plan Codex usageではGPT-5.5を示していましたが、API-key行ではそのモデルを基準として列挙していませんでした。将来変わった場合は、例より先にルート対応を更新します。
価格は OpenAI Platform pricing を確認します。RPM、RPD、TPM、TPD、IPM、spend limitは API rate limits を確認します。rate limitは自動化の実行可能性に関係しますが、1日のドル見積もりそのものではありません。
日次シナリオで上限を作る

「1日いくつtokenか」を単独で聞いても答えは出ません。軽い日、普通の日、重い日という前提を置き、同じtoken構成をモデル別に比較します。
| シナリオ | Input tokens | Cached input tokens | Output tokens | gpt-5.4-mini | gpt-5.4 |
|---|---|---|---|---|---|
| 軽い日 | 0.6M | 0.2M | 0.08M | $0.83 | $2.75 |
| 普通の日 | 3M | 2M | 0.4M | $4.20 | $14.00 |
| 重い日 | 12M | 8M | 2M | $18.60 | $62.00 |
普通の日をgpt-5.4-miniで計算すると次のようになります。
text(3 * $0.75) + (2 * $0.075) + (0.4 * $4.50) = $4.20
gpt-5.4では同じtoken構成でも次の通りです。
text(3 * $2.50) + (2 * $0.25) + (0.4 * $15.00) = $14.00
この差は大きいです。モデル選択と出力量は、promptを数行削ることより支出に効きます。ドキュメント更新、小さな修正、初期調査なら、まず低コストで十分なモデルから始めます。
自分の作業で測る
最も信頼できるのは、自分の作業を30分から60分だけ測ることです。完璧なtelemetryがなくても、長い実行を続けるか止めるかの判断には十分役立ちます。
- 本番と同じルートで動かします。
- 実際に近いタスクを選びます。
- モデル、リポジトリ規模、読んだパス、触ったファイル、tool call、会話回数を記録します。
- API keyならOpenAI Platform Usageを確認します。
- 分類が見える場合はinput、cached input、outputを分けます。
- 金額だけ見える場合は、モデル価格から範囲を逆算します。
- 同じブロックが1日に何回あるかで掛け、retry用に25%から50%を足します。
例えば45分の代表タスクで2ドル使ったなら、同じ作業4回を単純に8ドルとは見ません。テスト失敗、追加ファイル、説明の長文化でoutputが増えるため、10ドルから12ドル程度の上限を先に検討する方が現実的です。
tokenを増やす要因
Codexは、読む量、覚える量、試す量、書く量が増えるほどtokenを使います。
| 要因 | 起きること | 抑え方 |
|---|---|---|
| 大きなリポジトリ文脈 | 多くのファイルがinput側に入る | 対象パスを限定し、生成物やログを外す |
| tool callの繰り返し | 読み取り、テスト、ログ確認が文脈を増やす | 受け入れ条件を先に出し、まとめて確認させる |
| 長いoutput | 説明、完全ファイル、ログ、まとめが高くつく | patch、commands、短い判断を優先する |
| cache reuseが低い | 同じような文脈でもcached inputにならない | 文脈を安定させ、不要な再起動を避ける |
| retryが多い | 失敗テストでturnが増える | stop conditionを先に決める |
| 強いモデルを常用 | すべてのtokenカテゴリに高単価が掛かる | 必要なときだけ上位モデルにする |
節約は派手ではありません。範囲を狭め、出力を短くし、再実行を減らし、標準モデルを安くし、止める条件を明確にすることが一番効きます。
Subscription、credits、API keyの使い分け
同じCodexでも、支払いの形は同じではありません。
| 作業 | 先に試すルート | 理由 |
|---|---|---|
| 個人の対話型コーディング | ChatGPTログイン | included usageとcreditsがこの画面向け |
| ローカル自動化と使用量管理 | API key | Usage、budgets、project limitを管理しやすい |
| CI、定期実行、SDK、backend | API key | 非対話型credentialとproject予算が必要 |
| クラウドタスクやcode review | ChatGPT / workspace | ローカルCLIの式だけでは見積もれない |
| included usageを使い切った | creditsまたはreset待ち | creditsはsupported usageの拡張で、通常のAPI-key請求とは別物 |
全体のプラン制限は OpenAI Codex Usage Limits: Plus, Pro 5x/20x, Business Credits, and API Key Rules に任せます。API-keyで請求されるローカルCodex作業では、日次の支出上限と停止条件を別に持つ必要があります。
長い実行の停止ルール

長いセッションでは、追加文脈より先に停止ルールが必要です。
- ソフト上限: 予定予算の70%に達したら一時停止します。
- ハード上限: API keyではPlatform budgetsやproject limitを使います。
- 範囲上限: 合意していないファイルを読み始めたら止めます。
- 出力上限: 具体的なdiffではなく長い説明が続くなら止めます。
- retry上限: 同じ失敗が繰り返されたら診断をやり直します。
実務では次のように書きます。
textBudget: $15/day for routine Codex CLI API-key work Pause at: $10.50 estimated or observed usage Default model: gpt-5.4-mini Escalation: gpt-5.4 only for hard diagnosis or architecture change Output rule: patch and decision first
この金額を全員に勧めるわけではありません。重要なのは、金額、ルート、標準モデル、上位モデルに切り替える条件を事前に書くことです。
予想より高い請求を調べる順番
高い請求は、推測ではなく順番で調べます。
- ルート: ChatGPTログインのつもりでAPI keyを使っていないか。
- モデル: 見積もりより高いモデルが使われていないか。
- Output: 長い説明、完全ファイル、ログ、まとめを何度も出していないか。
- Context: 対象パスではなくリポジトリ全体を読んでいないか。
- Retries: テスト失敗でturnが増えていないか。
- Automation: CIやscriptが同じフローを複数回起動していないか。
- Limits: rate limitやspend limitが失敗とretryを誘発していないか。
API-key支出のledgerはOpenAI Platform Usageです。ChatGPTルートはCodex Settingsと/statusで確認します。期待と違う場合は、次の長い作業を始める前にルートを直します。
よくある質問
Codex CLIは1日に何token使いますか?
共通の数字はありません。ルート、モデル、リポジトリ文脈、読んだファイル、tool call、outputの長さ、retry、cache reuse、作業時間で変わります。
Codex CLIのAPIコストはどう計算しますか?
API-key課金を確認し、input tokens、cached input tokens、output tokensを分けます。それぞれを現在のモデル価格で掛けて合計します。
cached inputをなぜ分けますか?
単価が違うからです。cached inputは繰り返し文脈を安くする可能性がありますが、すべてのinputが自動でcache価格になるわけではありません。
API keyはChatGPT PlusやProより安いですか?
作業によります。低量で管理された自動化はAPI keyが向くことがあり、長時間の個人対話ではincluded usageのあるChatGPTログインが向くことがあります。
ChatGPT creditsはAPI-key請求に使えますか?
通常そう考えるべきではありません。creditsはChatGPTルートのCodex体験に属し、API-key usageはOpenAI Platform billingです。
長いCodex CLIタスクを安全に始めるには?
ルートを確認し、標準モデルを決め、文脈を絞り、短いoutputを求め、代表サンプルを測り、予算の70%で止まる条件を書いてから始めます。
