본문으로 건너뛰기

Claude Rate Exceeded 오류: 재시도 전에 제한 소유자부터 확인하기

L
9 분 소요Claude

Claude Rate Exceeded 는 하나의 제한이 아닙니다. surface, reset signal, owner 를 확인하고 같은 route 에서 검증한 뒤 재시도하세요.

Claude Rate Exceeded 오류: 재시도 전에 제한 소유자부터 확인하기

Claude 가 "Rate Exceeded", "Claude Error: Rate limit reached", 또는 Claude Code 429 를 보여주면 하나의 API quota 로 단정하지 마세요. 먼저 발생 surface 를 나눕니다. Claude.ai / Desktop usage window, Claude Code subscription auth, Claude Code API key route, direct Anthropic API, Bedrock / Vertex AI, gateway, 또는 temporary capacity / burst control 일 수 있습니다. 각 surface 의 reset signal 과 owner 는 다릅니다.

SurfaceOwnerFirst moveProofNext step
Claude.ai / Desktop / mobileClaude plan usage window or capacitySettings > Usage 확인, 긴 chat/files 축소5-hour/session/weekly reset, usage bars, capacity text더 작은 새 chat, 대기, extra usage, later retry
Claude Code subscription authClaude surface 와 공유되는 plan/session window/usage 또는 reset message 확인session limit, weekly limit, model limitreset 대기, model/workload 낮추기
Claude Code API keyConsole workspace or cloud project/status 로 active credential 확인API-key route, provider logs, 429 bodyconcurrency 감소 또는 owner dashboard 확인
Direct Anthropic APIAnthropic workspace/model rate limitretry-after 대기 후 request 축소HTTP 429, rate_limit_error, rate-limit headers같은 route 에서 작은 request 1회 retry
Bedrock / Vertex AI / gatewayprovider project, region, tenant, proxy policyprovider/gateway logs 확인Provider 429, throttling, tenant policy해당 quota 조정 또는 operator 문의
Capacity / burst / accelerationservice load or traffic shape잠시 대기, status 확인, ramp 완화capacity text, recent incident, RPS spikelater retry 또는 작은 동일 route 요청 검증

중지 규칙은 단순합니다. owner 확인 전에는 key, plan, provider, model 을 바꾸지 마세요. route 를 바꿔 error 가 사라졌다면 진단이 아니라 우회일 수 있습니다.

제한을 만든 route 를 먼저 찾기

rate limit reached 라는 문장만으로는 어떤 bucket 이 막혔는지 알 수 없습니다. api.anthropic.com 직접 호출이면 HTTP 429, response body, rate-limit headers 를 봅니다. Claude Code 는 ANTHROPIC_API_KEY 가 설정되어 있으면 API-key workspace 문제일 수 있고 subscription session 과 다릅니다. Bedrock, Vertex AI, gateway 는 provider quota, region, tenant policy 가 owner 일 수 있습니다.

먼저 credential, owner dashboard, 같은 model/provider/region/prompt 로 한 번 재현 가능한지 확인합니다.

문구에서 owner branch 로 가는 지도

Claude Code 500, 529, plan window 는 Claude Code 500/529/rate limit router를 사용하세요. Claude Code rate limit 세부는 Claude Code rate limit에 있습니다.

Claude.ai 또는 Desktop: usage window 먼저 확인

Claude.ai, Desktop, mobile 에서 HTTP headers 없이 error 가 보이면 product surface limit 으로 먼저 처리합니다. Usage limits 는 일정 기간 Claude 를 얼마나 사용할 수 있는지이고, length limits 는 하나의 conversation 이 얼마나 길어질 수 있는지입니다. 긴 chat, 큰 files, tools, Research, connectors, 무거운 model 은 window 를 빠르게 소모합니다.

API key 수정부터 시작하지 마세요. Settings > Usage 를 확인하고 reset time 을 읽고, thread 가 크면 더 작은 새 chat 을 시작하고, 필요 없는 files/tools 를 제거하세요. Capacity constraints 는 일시적 load management 일 수 있으며 status page outage 로 보이지 않을 수 있습니다.

Direct Anthropic API 는 header 를 믿기

Direct Anthropic API 의 HTTP 429 는 rate_limit_error 입니다. retry-after, anthropic-ratelimit headers, RPM, input tokens per minute, output tokens per minute 이 다음 행동을 정합니다. 월간 사용량이 남아도 rolling minute bucket 은 막힐 수 있습니다.

다음 요청은 작고 느려야 합니다. concurrency 를 낮추고, max output 을 줄이고, 작업을 나누고, cache 를 쓰고, 같은 route 에서 한 번만 retry 합니다.

Direct API 429 header and retry loop

Claude Code 는 active route 부터 확인

Claude Code 에서는 /status 와 credential path 가 우선입니다. ANTHROPIC_API_KEY 가 있으면 subscription 이 아니라 API key workspace 의 제한일 수 있습니다. API key vs subscription billingClaude Code API configuration을 같이 보세요.

usage 가 남아도 요청이 막히는 이유

Rate limit 은 하나의 monthly counter 가 아니라 rolling bucket 입니다. 긴 context 는 input token, 긴 answer 는 output token, 많은 작은 요청은 RPM, 급격한 증가량은 acceleration control 을 건드립니다.

다음 요청을 안전하게 고치기

한 번에 하나만 바꾸세요. jitter backoff, worker 제한, max output 감소, queue, request_id 와 headers logging 을 적용합니다. 검증은 같은 route, credential, model, workload 로 진행합니다.

Provider 또는 gateway 제한

Bedrock, Vertex AI, gateway 를 통해 Claude 를 쓰면 Anthropic Console 이 owner 가 아닐 수 있습니다. provider quota, project/location limit, gateway log 를 먼저 확인하세요.

지원 전달 증거 세트

동일 경로 재현이 다시 실패하면 exact message, timestamp, request_id, headers, model, workspace/project/region, 경로 소유자, status result, minimal reproduction 을 보냅니다. key, token, personal data 는 보내지 마세요.

직접 API 라면 request_id 와 headers 가 핵심입니다. Bedrock 또는 Vertex AI 라면 project, region, quota page 가 핵심입니다. gateway 라면 tenant, upstream route, policy hit 이 핵심입니다. 이 구분이 없으면 support 는 다시 다른 소유자에게 확인하라고 돌려보낼 가능성이 큽니다.

Claude 지원 전달 증거

자주 묻는 질문

항상 direct API 429 인가요?

아닙니다. 경로 소유자를 먼저 증명해야 합니다.

운영 로그에는 무엇을 남겨야 하나요?

마지막 성공 요청, 첫 실패 요청, 현재 실패 요청을 한 줄씩 비교하세요. route, credential, model, region, input size, output limit, concurrency, retry-after, status result 를 기록하면 어떤 bucket 이 막혔는지 빠르게 좁힐 수 있습니다.

API key 를 바꿔야 하나요?

먼저 바꾸지 마세요. active route 를 확인한 뒤 판단합니다.

usage 가 남아 보이는 이유는?

monthly usage 와 rolling RPM/token/burst window 는 다릅니다.

status 가 정상이라면?

headers, /status, provider dashboard, gateway logs 를 계속 확인합니다.

support 에 언제 보내나요?

같은 route 재현과 evidence packet 이 준비된 뒤입니다.

Share:

laozhang.ai

One API, All AI Models

AI Image

Gemini 3 Pro Image

$0.05/img
80% OFF
AI Video

Sora 2 · Veo 3.1

$0.15/video
Async API
AI Chat

GPT · Claude · Gemini

200+ models
Official Price
Served 100K+ developers
|@laozhang_cn|Get $0.1