Перейти к основному содержанию

Claude API Rate Limit Reached: сначала найдите владельца лимита

L
5 мин чтенияClaude API

Проверьте владельца маршрута, заголовки ответа, активные учетные данные и повтор на том же пути, чтобы восстановить Claude API без ложных действий.

Claude API Rate Limit Reached: сначала найдите владельца лимита

Не повторяйте запрос вслепую. Сначала определите владельца маршрута: Anthropic API, Claude Code, провайдер, шлюз или burst-limit.

SurfaceOwnerFirst moveProofNext step
Direct Anthropic APIAnthropic workspaceWait by retry-after and reduce shapeHTTP 429 and rate-limit headersRetry one smaller same-route request
Claude Code API keyAPI key workspaceCheck /status and credential routeClaude Code status plus API logsLower Code API traffic or inspect Console
Claude Code planSubscription or session windowDo not start with API headersPlan or period wordingUse the Claude Code limit guide
Bedrock or Vertex AICloud projectOpen provider quotaProvider 429 or throttlingChange provider quota or region
GatewayGateway tenantRead gateway logsTenant or upstream policyAdjust gateway limit or contact operator
BurstTraffic shapeQueue and slow rampRPS or concurrency spikeVerify the same route

Главное правило: не меняйте ключ, тариф, провайдера или модель до проверки владельца маршрута. Если вы сменили маршрут, вы уже не проверяете ту же ошибку.

Сначала определите маршрут

Фраза rate limit reached не доказывает, что исчерпан один конкретный лимит Anthropic API. Прямой запрос к api.anthropic.com проверяется через HTTP 429, тело ответа и заголовки. Claude Code может идти через ANTHROPIC_API_KEY, а может идти через подписку. Bedrock, Vertex AI и gateway могут вернуть похожий текст, но владелец лимита будет в облачном проекте, регионе, tenant-policy или upstream-route.

Задайте три вопроса: какая учетная запись обработала запрос, какой dashboard владеет этой учетной записью, и можно ли воспроизвести ошибку один раз на том же маршруте без смены модели, региона, provider или prompt.

Карта веток по тексту ошибки

Если строка относится к Claude Code 500, 529 или plan window, используйте Claude Code 500/529/rate limit router. Для отдельной ветки Claude Code rate limit есть Claude Code rate limit.

Direct Anthropic API: доверяйте заголовкам

Для прямого Anthropic API HTTP 429 соответствует rate_limit_error. Следующий шаг задают retry-after и anthropic-ratelimit заголовки. RPM, input tokens per minute и output tokens per minute могут блокировать независимо. Остаток месячного бюджета не отменяет короткое окно.

Сделайте следующий запрос меньше: уменьшите concurrency, задайте backoff с jitter, снизьте max output, разбейте длинные задачи, кешируйте стабильный context и повторите один запрос на том же route.

Цикл header и retry

Claude Code: сначала active route

В Claude Code важно не перепутать подписку и API-key route. /status показывает активный путь. Если задан ANTHROPIC_API_KEY, ошибка принадлежит workspace ключа, а не обязательно Pro или Max. Смотрите API key vs subscription billing и Claude Code API configuration.

Почему usage есть, а запрос заблокирован

Лимиты часто работают как rolling buckets. Длинный context давит на input tokens, длинный answer давит на output tokens, много коротких запросов давят на RPM, а резкий рост нагрузки может сработать как acceleration control. Поэтому покупка большего плана не является первым решением.

Как исправить следующий запрос

Меняйте только одну переменную: ограничьте workers, добавьте retry budget, снизьте max output, поставьте очередь, логируйте request_id, владельца маршрута, model, workspace, region, retry-after и reset values. Повтор должен идти на том же маршруте.

Если команда одновременно меняет prompt, модель, gateway и число workers, диагноз теряется. Сначала зафиксируйте failing route и сравните три события: последний успешный запрос, первый отказ и текущий отказ. Ищите, что изменилось: request rate, input tokens, output tokens, region, project, tenant, model или credential. Такой журнал превращает общее ощущение "Claude ограничивает нас" в проверяемую гипотезу.

Для production-клиента полезно добавить два счетчика еще до следующего инцидента: лимит параллельных запросов по маршруту и лимит ожидаемых output tokens по задаче. Первый счетчик защищает RPM, второй снижает давление на OTPM. Если оба значения записаны рядом с request_id, команда быстрее поймет, какой контроллер сработал и нужно ли ждать окно, менять форму запроса или просить увеличение лимита.

Отдельно сохраняйте решение оператора: почему команда ждала, снижала concurrency, уменьшала output или шла к провайдеру. Через неделю именно эта короткая заметка объяснит, почему выбранный fix был безопасным, а не случайным обходом. Это особенно важно для ночных инцидентов и последующего разбора.

Provider или gateway

Если Claude вызывается через Bedrock, Vertex AI или gateway, Anthropic Console может быть не владельцем ошибки. Ищите evidence в provider quota, project/location limits, gateway logs и tenant policy.

Пакет для эскалации

Эскалируйте после одного повтора на том же маршруте. Приложите exact message, timestamp, request_id, headers, model, workspace/project/region, владельца маршрута, status-page result и минимальный запрос. Не отправляйте ключи, токены и пользовательские данные.

Для прямого API важнее всего request_id и headers. Для Bedrock или Vertex AI важнее quota page, project, region и service account. Для gateway важны tenant key, upstream route и policy, которая сработала. Чем точнее выбран владелец, тем меньше вероятность, что support вернет вас к другому провайдеру. Если у вас нет request_id, отправьте точное время, регион, модель, размер запроса и одно воспроизведение; это все равно лучше, чем письмо "rate limit reached, помогите".

Пакет эскалации Claude API

Часто задаваемые вопросы

Это всегда direct API 429?

Нет. Нужно доказать владельца маршрута.

Нужно ли менять API key?

Нет, не первым шагом. Сначала подтвердите активный route.

Почему quota еще есть?

Потому что monthly usage и rolling RPM/token/burst window разные.

Что если status page зеленая?

Продолжайте проверку route: headers, /status, provider quota или gateway logs.

Когда писать в support?

Когда same-route retry снова падает и пакет evidence готов.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус