メインコンテンツへスキップ

Claude API の Rate Limit Reached は、先に制限の持ち主を特定する

L
7 分で読めますClaude API

制限の持ち主、response header、credential path、同一路由での確認を使って Claude のレート制限を安全に切り分けます。

Claude API の Rate Limit Reached は、先に制限の持ち主を特定する

まず連続リトライを止めます。direct API、Claude Code、provider、gateway、burst のどれが制限を持つかを確認します。

SurfaceOwnerFirst moveProofNext step
Direct Anthropic APIAnthropic workspaceWait by retry-after and reduce shapeHTTP 429 and rate-limit headersRetry one smaller same-route request
Claude Code API keyAPI key workspaceCheck /status and credential routeClaude Code status plus API logsLower Code API traffic or inspect Console
Claude Code planSubscription or session windowDo not start with API headersPlan or period wordingUse the Claude Code limit guide
Bedrock or Vertex AICloud projectOpen provider quotaProvider 429 or throttlingChange provider quota or region
GatewayGateway tenantRead gateway logsTenant or upstream policyAdjust gateway limit or contact operator
BurstTraffic shapeQueue and slow rampRPS or concurrency spikeVerify the same route

停止ルールは明確です。owner を確認する前に key、plan、provider、model を変えないでください。途中で route を変えると、同じ失敗を検証できなくなります。

まず制限を出した route を特定する

rate limit reached という文言だけでは、どの bucket が詰まったかは分かりません。api.anthropic.com への direct request なら HTTP 429、response body、rate-limit headers を見ます。Claude Code は ANTHROPIC_API_KEY があれば API-key workspace の問題になり、subscription session とは別です。Bedrock、Vertex AI、gateway では provider 側の quota や tenant policy が owner になる場合があります。

確認するのは、処理した credential、owner dashboard、同じ model/provider/region/prompt で一回だけ再現できるかです。

文言から owner branch へ

Claude Code の 500、529、plan window は Claude Code 500/529/rate limit router を使ってください。Claude Code の rate limit 固有の話は Claude Code rate limit です。

Direct Anthropic API は header を先に見る

Direct Anthropic API の HTTP 429 は rate_limit_error です。retry-after、anthropic-ratelimit headers、RPM、input tokens per minute、output tokens per minute が次の行動を決めます。月次の残量が見えていても、短い rolling window は詰まります。

次の request は小さく、遅く、検証しやすくします。concurrency を下げ、max output を抑え、job を分割し、cache を使い、同じ route で一回だけ retry します。

Direct API 429 header と retry loop

Claude Code は active route を確認する

Claude Code では /status と credential path が先です。ANTHROPIC_API_KEY が有効なら、subscription の問題ではなく API key workspace の問題かもしれません。API key vs subscription billingClaude Code API configuration で境界を確認してください。

usage が残っているのに止まる理由

Rate limit は単一の月次 counter ではなく rolling bucket です。長い context は input token、長い回答は output token、多数の小 request は RPM、急な増加は acceleration control に触れます。

次の request を安全に直す

一度に一つだけ変えます。jitter backoff、worker 制限、max output 低下、queue、request_id と header の logging を入れます。検証は同じ route、同じ credential、同じ model で行います。

Provider または gateway の制限

Bedrock、Vertex AI、gateway 経由では、Anthropic Console が持ち主ではないことがあります。provider quota、project/location limits、gateway logs を見てから上位対応に進みます。

上位対応用の証拠セット

同じ route での再現がまだ失敗する場合、exact message、timestamp、request_id、headers、model、workspace/project/region、制限の持ち主、status result、最小 reproduction をまとめます。key、token、個人データは送らないでください。

直 API なら request_id と headers が中心です。Bedrock や Vertex AI なら project、region、quota page が中心です。gateway なら tenant、upstream route、policy hit が中心です。この区別を先に書くと、support はどの窓口で処理すべきかを早く判断できます。

Claude API エスカレーション用証拠

よくある質問

常に direct API 429 ですか?

いいえ。制限の持ち主を先に証明します。

調査メモには何を残すべきですか?

成功した最後の request、失敗した最初の request、現在の request を並べ、route、credential、model、region、input size、output limit、concurrency、status result を残します。これで単なる感覚ではなく、どの bucket が変わったかを説明できます。

API key を変えるべきですか?

最初の手ではありません。active route を確認してからです。

usage が残るのはなぜですか?

月次 usage と rolling RPM/token/burst window は別物です。

status が正常なら?

headers、/status、provider dashboard、gateway logs を続けて確認します。

support に送るタイミングは?

同じ route で再現し、evidence packet が揃った後です。

Share:

laozhang.ai

One API, All AI Models

AI Image

Gemini 3 Pro Image

$0.05/img
80% OFF
AI Video

Sora 2 · Veo 3.1

$0.15/video
Async API
AI Chat

GPT · Claude · Gemini

200+ models
Official Price
Served 100K+ developers
|@laozhang_cn|Get $0.1