Не повторяйте запрос вслепую. Сначала определите владельца маршрута: Anthropic API, Claude Code, провайдер, шлюз или burst-limit.
| Surface | Owner | First move | Proof | Next step |
|---|---|---|---|---|
| Direct Anthropic API | Anthropic workspace | Wait by retry-after and reduce shape | HTTP 429 and rate-limit headers | Retry one smaller same-route request |
| Claude Code API key | API key workspace | Check /status and credential route | Claude Code status plus API logs | Lower Code API traffic or inspect Console |
| Claude Code plan | Subscription or session window | Do not start with API headers | Plan or period wording | Use the Claude Code limit guide |
| Bedrock or Vertex AI | Cloud project | Open provider quota | Provider 429 or throttling | Change provider quota or region |
| Gateway | Gateway tenant | Read gateway logs | Tenant or upstream policy | Adjust gateway limit or contact operator |
| Burst | Traffic shape | Queue and slow ramp | RPS or concurrency spike | Verify the same route |
Главное правило: не меняйте ключ, тариф, провайдера или модель до проверки владельца маршрута. Если вы сменили маршрут, вы уже не проверяете ту же ошибку.
Сначала определите маршрут
Фраза rate limit reached не доказывает, что исчерпан один конкретный лимит Anthropic API. Прямой запрос к api.anthropic.com проверяется через HTTP 429, тело ответа и заголовки. Claude Code может идти через ANTHROPIC_API_KEY, а может идти через подписку. Bedrock, Vertex AI и gateway могут вернуть похожий текст, но владелец лимита будет в облачном проекте, регионе, tenant-policy или upstream-route.
Задайте три вопроса: какая учетная запись обработала запрос, какой dashboard владеет этой учетной записью, и можно ли воспроизвести ошибку один раз на том же маршруте без смены модели, региона, provider или prompt.

Если строка относится к Claude Code 500, 529 или plan window, используйте Claude Code 500/529/rate limit router. Для отдельной ветки Claude Code rate limit есть Claude Code rate limit.
Direct Anthropic API: доверяйте заголовкам
Для прямого Anthropic API HTTP 429 соответствует rate_limit_error. Следующий шаг задают retry-after и anthropic-ratelimit заголовки. RPM, input tokens per minute и output tokens per minute могут блокировать независимо. Остаток месячного бюджета не отменяет короткое окно.
Сделайте следующий запрос меньше: уменьшите concurrency, задайте backoff с jitter, снизьте max output, разбейте длинные задачи, кешируйте стабильный context и повторите один запрос на том же route.

Claude Code: сначала active route
В Claude Code важно не перепутать подписку и API-key route. /status показывает активный путь. Если задан ANTHROPIC_API_KEY, ошибка принадлежит workspace ключа, а не обязательно Pro или Max. Смотрите API key vs subscription billing и Claude Code API configuration.
Почему usage есть, а запрос заблокирован
Лимиты часто работают как rolling buckets. Длинный context давит на input tokens, длинный answer давит на output tokens, много коротких запросов давят на RPM, а резкий рост нагрузки может сработать как acceleration control. Поэтому покупка большего плана не является первым решением.
Как исправить следующий запрос
Меняйте только одну переменную: ограничьте workers, добавьте retry budget, снизьте max output, поставьте очередь, логируйте request_id, владельца маршрута, model, workspace, region, retry-after и reset values. Повтор должен идти на том же маршруте.
Если команда одновременно меняет prompt, модель, gateway и число workers, диагноз теряется. Сначала зафиксируйте failing route и сравните три события: последний успешный запрос, первый отказ и текущий отказ. Ищите, что изменилось: request rate, input tokens, output tokens, region, project, tenant, model или credential. Такой журнал превращает общее ощущение "Claude ограничивает нас" в проверяемую гипотезу.
Для production-клиента полезно добавить два счетчика еще до следующего инцидента: лимит параллельных запросов по маршруту и лимит ожидаемых output tokens по задаче. Первый счетчик защищает RPM, второй снижает давление на OTPM. Если оба значения записаны рядом с request_id, команда быстрее поймет, какой контроллер сработал и нужно ли ждать окно, менять форму запроса или просить увеличение лимита.
Отдельно сохраняйте решение оператора: почему команда ждала, снижала concurrency, уменьшала output или шла к провайдеру. Через неделю именно эта короткая заметка объяснит, почему выбранный fix был безопасным, а не случайным обходом. Это особенно важно для ночных инцидентов и последующего разбора.
Provider или gateway
Если Claude вызывается через Bedrock, Vertex AI или gateway, Anthropic Console может быть не владельцем ошибки. Ищите evidence в provider quota, project/location limits, gateway logs и tenant policy.
Пакет для эскалации
Эскалируйте после одного повтора на том же маршруте. Приложите exact message, timestamp, request_id, headers, model, workspace/project/region, владельца маршрута, status-page result и минимальный запрос. Не отправляйте ключи, токены и пользовательские данные.
Для прямого API важнее всего request_id и headers. Для Bedrock или Vertex AI важнее quota page, project, region и service account. Для gateway важны tenant key, upstream route и policy, которая сработала. Чем точнее выбран владелец, тем меньше вероятность, что support вернет вас к другому провайдеру. Если у вас нет request_id, отправьте точное время, регион, модель, размер запроса и одно воспроизведение; это все равно лучше, чем письмо "rate limit reached, помогите".

Часто задаваемые вопросы
Это всегда direct API 429?
Нет. Нужно доказать владельца маршрута.
Нужно ли менять API key?
Нет, не первым шагом. Сначала подтвердите активный route.
Почему quota еще есть?
Потому что monthly usage и rolling RPM/token/burst window разные.
Что если status page зеленая?
Продолжайте проверку route: headers, /status, provider quota или gateway logs.
Когда писать в support?
Когда same-route retry снова падает и пакет evidence готов.
