メインコンテンツへスキップ

Claude Codeトークン使用量ガイド:確認方法、減らし方、上限の考え方(2026)

A
20 分で読めますClaude Code

Claude Codeには一つの共通メーターがあるわけではありません。ProやMaxでは、Web・デスクトップ・モバイルのClaudeと共有する5時間セッションと週間制限が基準になります。API経路では、RPM、入力TPM、出力TPM、支出上限が基準になります。本記事では、なぜClaude Codeの使用量が速く増えるのか、`/status`と`/cost`でどう追跡するのか、そして作業効率を落とさずに消費を抑える方法を解説します。

Claude Codeトークン使用量ガイド:確認方法、減らし方、上限の考え方(2026)

Claude Codeが「高い」と感じやすいのは、普通のチャットとはコストの増え方が違うからです。ターミナルで短い依頼を一つ送っただけのつもりでも、Claude Codeはその裏でファイルを読み、ツールを呼び、結果を確認し、その内容を次のターンに持ち越します。さらにややこしいのは、いまの “usage” が一つの単純な数字ではないことです。ProやMaxで使っているなら、Claude CodeはWeb・デスクトップ・モバイルのClaudeと共有する使用枠の中で動き、5時間セッションと週間制限で見ます。ANTHROPIC_API_KEY が環境にある、あるいは pay-as-you-go に切り替えた場合は、Claude Codeはサブスク機能というよりAPIトラフィックになり、RPM、入力TPM、出力TPM、支出上限で考える必要があります。この二つを分けて考えるだけで、「なぜこんなに速く減るのか」はかなり説明できます。

この記事は、2026年4月2日時点で確認できる公開情報をもとに、Claude Codeの使用量が今どう数えられているのか、なぜ通常のチャットより早く消耗するのか、Settings > Usage/status/cost をどう使い分けるのか、そして最近のAnthropicのヘルプ更新後でも有効な節約策は何かを整理したものです。目的は、すぐ古くなる「週に何時間くらい使えるか」という表をもう一枚増やすことではありません。あなたの状況で本当に必要なのが、コンテキストを絞ることなのか、モデルを変えることなのか、extra usageを有効にすることなのか、それとも重い作業だけAPI課金に逃がすことなのかを判断できるようにすることです。

先に要点

  • Claude Codeには一つの共通使用メーターはありません。Pro/Maxでは5時間セッションと週間制限、API経路ではRPM、入力TPM、出力TPM、支出上限が中心になります。
  • 消費を大きく左右するのは、単純なプロンプト数よりコンテキストサイズです。リポジトリの広さ、長いセッション、ツールループ、MCPの厚み、高価なモデルが重なるほど消費は増えます。
  • Pro/Maxユーザーが最初に見るべきなのは Settings > Usage/status、会話単位で急に高くなった理由を知りたいときに重要なのは /cost です。
  • Sonnet 4.6 と Opus 4.6 は Claude Code で 1M コンテキストを使える経路がありますが、Claude有料プラン側では extra usage を含む条件とセットで考える必要があります。大きな窓は便利ですが、雑に使うと無駄も大きくなります。
  • 速い節約は「質問を減らす」ことより、古いセッションを切ること、適切に compact すること、普段は Sonnet や Haiku を選ぶこと、Claude が読む範囲を狭めることから生まれます。
  • どう考えても減り方がおかしいときは、まず課金経路、使っているモデル、コンテキストの大きさ、そして高負荷時間帯の影響を確認してください。

いまの Claude Code における “usage” とは何か

Claude Codeの使用量がプラン経路とAPI課金経路で分かれることを示す図

Claude Codeの使用量を一つのクォータだと思い込むのが、いちばん大きな誤解です。Anthropicは今、二つのかなり違う計測面を公開しており、Claude Codeは認証方法によってそのどちらにも乗り換えます。

ProまたはMaxのサブスクリプションで使っている場合、Claude CodeはWeb・デスクトップ・モバイルのClaudeと同じ共有プールから引かれます。現在のヘルプセンターは Settings > Usage を見るよう案内していて、そこには 現在の5時間セッション usage週間制限 が表示されます。個人プランで考えるべき正式な枠組みはこれです。だから、少し前までよく見かけた「日次クォータ」「固定のプロンプト回数」「毎週だいたい何時間」といった表現は、今ではかなり頼りにくくなっています。Anthropicは同じページで、ClaudeとClaude Codeがusageを共有すること、そして含まれる枠を使い切った後は、リセットを待つか、extra usageを有効にするか、Console経由のpay-as-you-goに移るかだと明確に書いています。

一方で、API key で Claude Code を使っている場合、数え方はまったく別物になります。AnthropicのAPIドキュメントでは requests per minuteinput tokens per minuteoutput tokens per minute が基本で、その上に支出上限やtierの条件が重なります。APIユーザーにとって重要なのは「プラン残量がどれくらいか」ではなく、「どの rate bucket に当たったのか」です。Consoleに残高があっても、ITPM や RPM に当たれば止まります。

さらに、かなり見落とされやすい挙動があります。Anthropicは ANTHROPIC_API_KEY が環境にあると、Claude CodeはPro/Maxよりそちらを優先して使うと明記しています。つまり「サブスクのusageを使っているつもり」が、そのままAPI請求に変わっていることがあります。誰かが「Claude Codeがトークンを一気に消費した」と言うとき、最初に確認すべきなのはトークン数そのものではなく、いまどの課金経路にいるかです。

この話をいちばん実務的に言い換えるなら、Pro/Maxでは5時間と週間の枠を管理し、APIではスループットと支出を管理する ということです。止められるという体感は似ていても、操作レバーはまったく違います。サブスク側はセッション窓、weekly limit、extra usage、時間帯の影響で考える。API側はRPM、ITPM、OTPM、キャッシュ、支出上限で考える。ここを混ぜると、Claude Codeのusageだけが急に不思議に見えてしまいます。

なぜ Claude Code は普通のチャットよりトークンを使うのか

コンテキスト、ツールループ、モデル経路、長いセッションがClaude Codeの消費を増やす様子を示す図

Claude Codeが普通のチャットより高く感じられるのは、単発のチャットをターミナルに移しただけの道具ではなく、コンテキストを何度も読み込み、ツールを呼び、ファイルを読み、修正し、検証し、その結果をまた次のターンへ運ぶエージェント型のツールだからです。

最大の要因は コンテキストの蓄積 です。AnthropicのClaude Code cost guide は、コストがコンテキストサイズに比例すると明言しています。コード作業だとこの影響がさらに強く出ます。読むファイルが一つ増えるたび、古い会話が一塊残るたび、MCPの定義が一つ増えるたびに、次のターンは重くなります。ずっと一つのスレッドで進めるのは便利に見えますが、後半になるほど「毎回たくさんの過去を引きずる高コストなセッション」になりやすいのです。

二つ目の要因は ツールの多いループ です。Claude Codeの価値は、答えるだけでなく、検索し、読み、編集し、コマンドを実行し、結果を確かめることにあります。だから「このバグを直して」という一文でも、普通のチャットで相談するのと、Claude Codeに実際に触らせるのとでは、内部の重みがまるで違います。ユーザーから見えるのは一回の依頼でも、裏では複数回の model/tool 反復が起き、それぞれがコンテキストを持って走っています。

三つ目は モデル経路と使えるコンテキスト窓 です。Anthropicの現在のヘルプページでは、有料Claudeプランは概ね 200K コンテキストを基準にしつつ、Claude Codeでは Sonnet 4.6 と Opus 4.6 が 1M に対応すると説明されています。API側でも Sonnet 4.6 と Opus 4.6 は 1M を受けられると書かれています。大きな窓は確かに強力ですが、無料の理解力ではありません。単に「もっと入れられる」ようになるだけで、雑に入れればそのぶん高くなります。

四つ目は 見えにくいバックグラウンドコスト です。Claude Codeのドキュメントは今、prompt caching が繰り返しの文脈を再利用すること、auto-compaction が履歴を要約すること、そして一部の背景処理が少量のトークンを消費することを明記しています。Anthropicはそれを通常セッションあたり $0.04 未満の小さなコストと表現していますが、大事なのは金額より原理です。Claude Codeのusageは、あなたが入力した文字数そのものをそのまま映してはいません。

だからこそ「数回しかプロンプトを送っていないのに高い」という感覚は、コスト判断としては弱いのです。重要なのは、どのくらい広いリポジトリを読み込んだか、セッションをどれだけ長く維持したか、どのモデル経路にいたか、Claude に不要な再発見をさせていないかです。

勘ではなく、どうやって usage を見るべきか

usageガイドとして本当に役に立つかどうかは、「感覚で見積もってください」で終わらないかどうかで決まります。Anthropicは今、いくつかの具体的な観測手段を出していますが、見る場所は分かれています。

Pro/Maxの個人ユーザー にとって、最も重要なのは Settings > Usage です。Anthropicのヘルプページは、そこに 現在の5時間セッション usage週間制限、そしてリセット時刻が表示されると説明しています。ターミナル側では、Pro/Max向けの案内に /status が出てきます。プラン枠の中で済ませたい、API課金への意図しない流出を避けたい、という場面なら /status は重い作業の前に見るべき最初の確認項目です。

一方で、このセッションがなぜ急に高くなったか を知りたいなら、重要なのは /cost です。Anthropicのコストガイドは、Claude Code内でトークン使用量を見る主なコマンドとして /cost を挙げています。問題が「プラン残量」ではなく「このスレッドのコスト上昇理由」なら、感覚ではなく /cost を見るべきです。さらに、コスト表示を status line に出す設定も用意されています。Claude Code を毎日使うなら、かなり価値があります。

Team、Enterprise、Console ユーザー 向けには、Anthropicはより本格的な Claude Code analytics も提供しています。アクティビティ、提案受け入れ率、受け入れられたコード行数、支出などが見られます。ただし、Anthropic自身が help center で明言している通り、個人のPro/Maxにはこの analytics はありません。フォーラムでよくある「隠れダッシュボードを見ればいい」という話は、個人プランには当てはまりません。

実際の使い分けは、だいたい次の通りです。

何を知りたいかいちばん合う手段
Pro / Max の残量はどれくらいかSettings > Usage/status
いまの Claude Code セッションがなぜ高いのか/cost と status line の cost 表示
チーム全体で Claude Code をどう使っているかClaude Code analytics(Team / Enterprise / Console)
どの API 制限に当たったのか429 応答、retry-after、Console の制限画面

もし一つだけ新しい習慣を選ぶなら、これがいいです。Claude Codeのusageを直感だけで判断しないこと。重い作業の前に /status、進行中に /cost。公開記事のだいたい何時間表より、こちらのほうがずっと信頼できます。

今本当に重要な価格と制限の見方

Claude CodeのPro、Max、API課金経路を比較する図

2026年4月時点のAnthropicは、サブスク価格はかなり明確に公開していますが、「その価格が正確にどれだけの作業量に相当するか」はかなり慎重にしか語っていません。だからここでは 公開された価格契約公開されていない実効容量 を分けて考えるのが大切です。

個人向けサブスクリプション では、Anthropicの pricing page が Pro は月額 $20、年払いなら月換算 $17 と明記しており、Claude Code と Claude Cowork を含む と書いています。Max は月額 $100 からで、Proの5倍または20倍のusage、より高い output 上限、混雑時の優先アクセスを提供すると案内されています。ここまでは公開された安定契約です。第三者記事が出す「だいたい週何時間」より、この公式表現のほうがずっと信頼できます。プラン選びそのものを深く見たいなら、Claude Code Pro vs Max 比較Claude Code 料金ガイド を見ると全体像がつかみやすいです。

API課金 のほうでは、Anthropicはトークン単価を明確に出しています。2026年4月2日時点で、pricing page は Sonnet 4.6 を入力100万トークンあたり $3、出力100万トークンあたり $15Opus 4.6 を $5 / $25Haiku 4.5 を $1 / $5 と示しています。prompt caching は別料金で、batch processing は 50% 割引 と案内されています。短時間の重い自動化や連続的なエージェント処理を行う人にとっては、こちらの単位コストのほうがサブスク文言より実務的です。

特に意味があるのが API tier の表 です。速度の問題なのか、支出の問題なのかを切り分けられるからです。

API tier入金条件RPMSonnet ITPMSonnet OTPM
Tier 1$55030,0008,000
Tier 2$401,000450,00090,000
Tier 3$2002,000800,000160,000
Tier 4$4004,0002,000,000400,000

これらはすべて Anthropic の現在の API rate-limit docs から取れる数値です。同じページでは、ほとんどのモデルで cache read は ITPM にカウントされない とも強調されています。つまり、安定したコンテキストを上手く再利用できれば、体感的には tier が一つ上がったのに近い効果が出ます。

コンテキスト窓の話も、少し前の解説よりずっと複雑です。Anthropic のヘルプページは、有料Claudeプランの基準を 200K コンテキスト としつつ、Claude Codeでは Sonnet 4.6 と Opus 4.6 が 1M を使える と説明しています。API側でも Sonnet 4.6 と Opus 4.6 は 1M を受けられる一方、他モデルはおおむね 200K+ のままです。実務上の答えは単純で、大きい窓は必要なときだけ使う ということです。雑にコンテキストを広げるほど、浪費も高くなります。

ではどう判断すればよいか。月次コストをある程度読みやすく保ちつつ、日常的に Claude Code を使うなら Pro または Max + extra usage がいちばん扱いやすいことが多いです。バースト処理、自動化、大量のエージェント作業、チーム運用のように、仕事単位でコストを分けて見たいなら API課金 のほうが管理しやすいケースが多いです。最もよくないのは、usageの悩みをすべて「もっと高いプランにすべきだ」で片付けることです。実際には、必要なのはきれいなセッション設計のほうかもしれません。

速度を落とさずに Claude Code の使用量を下げる7つの方法

最も効果的な最適化は、Claude Code を使わないことではなく、Claude に不要な仕事をさせないことです。

1. 無関係な作業に移る前に古い文脈を切る。 Anthropic のコストガイドは /clear を明確に勧めています。古い文脈はその後の全ターンに課金されるからです。重いユーザーにとって、これは最もレバレッジの大きい習慣です。スレッドを残したいなら名前を変えて、あとで /resume で戻ればいい。問題なのは、まったく別の作業を一つの英雄的セッションに押し込むことです。

2. スレッドが太り切る前に compact する。 Anthropic は /compact も推奨しており、CLAUDE.md で compaction 指示を書く方法も示しています。作業はまだ関連しているが、会話が冗長になりすぎたときに向いています。良い compact 指示は具体的です。現在のバグ仮説、変更したファイル、残っているテスト失敗だけを残す、といった形にしてください。

3. 勘ではなく /cost を見る。 コストを見るのが「もう高いと感じた後」だけなら、見るのが遅すぎます。進行中に /cost を見て、必要なら status line に出す。問題は早めに見えたほうが直しやすいです。

4. 普段は Sonnet、もっと単純な仕事では Haiku を増やす。 Anthropic の cost docs は、Sonnet が多くのコーディング作業を十分こなせて、Opus より安いことをはっきり書いています。Haiku はもっと単純なサブタスク向けだとも書かれています。つまり、整形、説明、軽いリファクタ、局所修正まで最も高い経路に流す必要はありません。Opus は本当に難しい設計、複雑なデバッグ、多段推論に残しておくのが合理的です。

5. MCP と探索のオーバーヘッドを減らす。 Claude Code のドキュメントは、MCP定義がデフォルトで遅延読み込みされること、そして /context で何がスペースを食っているか見えることを説明しています。同時に、CLI があるなら CLI を優先するほうがコンテキスト効率が良いとも勧めています。gitghrg、クラウドCLI があるなら、巨大なMCPインベントリを背負うより軽いことが多いです。

6. Claude が読む量を最初から減らす。 Anthropic は型付き言語向けの code intelligence プラグインを勧めています。シンボル単位の正確な移動ができれば、無駄なファイル読み込みが減るからです。また hooks や skills で、Claude が本体の文脈を読む前に情報を整形・絞り込むことも推奨しています。これはかなり過小評価されている節約策です。巨大なログや生のテスト出力、同じ discovery フェーズを毎回そのまま与えているなら、問題はプランではなく前処理です。

7. その週に合った支払い面を選ぶ。 Pro/Max の help pages は、含まれる usage が尽きたときの逃げ道として extra usage と pay-as-you-go を明示しています。一時的な移行作業、重いリファクタ週間、エージェントを大量に回すスプリントでは、通常の月額プランだけで吸収しようとするより、最初から適した経路へ逃がすほうが合理的なことが多いです。

この七つの根っこは同じです。コンテキストを絞り、モデルを意識して選び、Claude にすでに分かっていることを何度も再学習させない。それが最も効きます。

それでも usage がおかしいと感じるとき

良い usage ガイドは、正常系だけでなく、体感がズレる局面も説明するべきです。

一つ目は 認証経路の取り違え です。環境に API key があると、Claude Code がサブスクではなくAPI課金で動くことがあります。ユーザーの感覚では「Claude Code が急にトークンを食い始めた」ですが、実際には billing surface が変わっただけかもしれません。

二つ目は 制限挙動の揺れ です。2026年3月末には、GitHub issue、Reddit、テックメディアで、5時間 usage が妙に早く尽きる、高負荷時間帯に絞り込みが強い、といった報告が出ていました。Anthropic のヘルプページは5時間制限や週間制限の存在自体は説明していますが、完全に固定された動的制御表を公開しているわけではありません。ここで一番安全な結論は、古い静的推定より、現在のプロダクト画面のほうを信じる です。体感と古い記事がズレたら、Settings > Usage/status/cost を優先してください。

三つ目は 大きすぎるコンテキスト経路を無意識に使っていること です。1M コンテキストをめぐる最近の議論は誤解を生みやすいですが、Anthropic の公式ページが言っているのは「Sonnet 4.6 と Opus 4.6 が Claude Code で 1M を扱える」ということです。それは「常に最大窓を使うべき」という意味ではありません。最近 usage が急に重くなったと感じるなら、まず小さいモデル、小さい文脈、新しいセッション、API key 経路の有無、時間帯の影響という順番で疑うほうが安全です。

もし必要なのが使用量の考え方ではなく、すでに出ているエラーの対処なら、Claude Code “Rate limit reached” 修正ガイド を見てください。こちらは「なぜそうなるのか」を説明する記事で、あちらは「いま何をすれば復帰できるか」を扱う記事です。

よくある質問

Claude Code は Web版Claude と別枠ですか?

個人のPro/Maxでは別枠ではありません。Anthropic は Claude と Claude Code が同じ使用枠を共有すると明記しています。API課金で使う場合は別の仕組みで、そこで初めて別の速度制限や支出管理になります。

Claude Code の 1M コンテキストはいつでも使えますか?

いいえ。現在のヘルプページでは、Claude有料プランは通常200Kを基準にしつつ、Claude Code では Sonnet 4.6 と Opus 4.6 が 1M に対応すると説明されています。API側でも Sonnet 4.6 と Opus 4.6 は 1M 対応です。ただし、モデルが1M対応していることと、常にその経路を使うべきことは同じではありません。

個人Pro/Maxで Claude Code analytics は使えますか?

現時点では使えません。Anthropic の usage analytics 記事は、Team、Enterprise、Console 向けで、個人 Pro/Max は対象外だと明記しています。個人ユーザーは Settings > Usage/status/cost を使うのが正しい見方です。

prompt caching は使用量削減に役立ちますか?

はい。ただし効き方は経路によって違います。Anthropic の API docs は、多くのモデルで cache read が ITPM にカウントされないと説明しています。より広い意味では、安定した繰り返しコンテキストを毎回最初から読ませないこと自体が usage 節約になります。実務では「同じ文脈は再利用できる形にしておく」が基本です。

Pro のままでいいのか、Max に上げるのか、APIに行くのか、どう決めればいいですか?

Claude Code が毎日の補助として役立つが、まだ全日稼働の主役ではないなら、まず Pro が妥当です。通常業務でしょっちゅうリセット待ちが痛いなら Max を検討してください。重いスパイク、自動化、チーム運用、あるいはコストと throughput を明確に分けたいなら API 課金のほうが分かりやすいことが多いです。

最初は平気なのに、途中から急に高くなるのはなぜですか?

セッションがだんだん重くなるからです。会話履歴、読み込んだファイル、ツール出力、モデル経路の重みが後ろのターンほど積み上がります。解決策は「質問回数を減らす」より、セッションを切る、compact する、必要な文脈だけに絞る、のほうが当たりやすいです。

Share:

laozhang.ai

One API, All AI Models

AI Image

Gemini 3 Pro Image

$0.05/img
80% OFF
AI Video

Sora 2 · Veo 3.1

$0.15/video
Async API
AI Chat

GPT · Claude · Gemini

200+ models
Official Price
Served 100K+ developers
|@laozhang_cn|Get $0.1