Если Claude показывает "Rate Exceeded", "Claude Error: Rate limit reached" или строку 429 в Claude Code, не считайте это одним лимитом API. Сначала определите поверхность: Claude.ai/Desktop usage window, Claude Code через подписку, Claude Code через API key, прямой Anthropic API, Bedrock/Vertex AI, gateway или временное управление нагрузкой. У каждой ветки свой reset-сигнал и свой владелец.
| Surface | Owner | First move | Proof | Next step |
|---|---|---|---|---|
| Claude.ai / Desktop / mobile | Usage window or capacity management | Check Settings > Usage, reduce long chats/files, wait for shown reset | 5-hour, session, weekly reset, usage bars, capacity text | Start a smaller chat, wait, enable extra usage if available |
| Claude Code subscription auth | Plan/session window shared with Claude surfaces | Run /usage or read the reset message | session limit, weekly limit, model limit | Wait, lower model/workload, or use extra usage |
| Claude Code API key | Console workspace or cloud project | Run /status and confirm active credential | API-key route, provider logs, 429 body | Lower concurrency or inspect owner dashboard |
| Direct Anthropic API | Anthropic workspace/model rate limit | Wait by retry-after and reduce shape | HTTP 429, rate_limit_error, rate-limit headers | Retry one smaller same-route request |
| Bedrock, Vertex AI, gateway | Provider project, region, tenant, proxy policy | Open provider/gateway logs | Provider 429, throttling, tenant policy | Change that quota or contact that operator |
| Capacity, burst, acceleration | Service load or traffic shape | Wait briefly, check status, slow the ramp | Capacity text, recent incident, RPS spike | Retry later or verify a smaller same-route request |
Главное правило: не меняйте ключ, тариф, провайдера или модель до проверки владельца маршрута. Если ошибка исчезла после смены маршрута, это еще не диагноз.
Сначала определите маршрут
Фраза rate limit reached не доказывает, что исчерпан один конкретный лимит Anthropic API. Прямой запрос к api.anthropic.com проверяется через HTTP 429, тело ответа и заголовки. Claude Code может идти через ANTHROPIC_API_KEY, а может идти через подписку. Bedrock, Vertex AI и gateway могут вернуть похожий текст, но владелец лимита будет в облачном проекте, регионе, tenant-policy или upstream-route.
Задайте три вопроса: какая учетная запись обработала запрос, какой dashboard владеет этой учетной записью, и можно ли воспроизвести ошибку один раз на том же маршруте без смены модели, региона, provider или prompt.

Если строка относится к Claude Code 500, 529 или plan window, используйте Claude Code 500/529/rate limit router. Для отдельной ветки Claude Code rate limit есть Claude Code rate limit.
Claude.ai или Desktop: сначала проверьте окно usage
Если ошибка появилась в Claude.ai, Desktop или mobile без HTTP headers, сначала считайте это лимитом product surface. Usage limits задают, сколько вы можете использовать Claude за период времени, а length limits относятся к размеру одного разговора. Длинные чаты, файлы, tools, Research, connectors и более тяжелые модели быстрее расходуют окно.
Не начинайте с API-key fix. Проверьте Settings > Usage, прочитайте reset time, начните меньший новый chat, уберите лишние файлы/tools или подождите. Capacity constraints могут быть временным управлением нагрузкой и не всегда выглядят как status-page outage.
Direct Anthropic API: доверяйте заголовкам
Для прямого Anthropic API HTTP 429 соответствует rate_limit_error. Следующий шаг задают retry-after и anthropic-ratelimit заголовки. RPM, input tokens per minute и output tokens per minute могут блокировать независимо. Остаток месячного бюджета не отменяет короткое окно.
Сделайте следующий запрос меньше: уменьшите concurrency, задайте backoff с jitter, снизьте max output, разбейте длинные задачи, кешируйте стабильный context и повторите один запрос на том же route.

Claude Code: сначала active route
В Claude Code важно не перепутать подписку и API-key route. /status показывает активный путь. Если задан ANTHROPIC_API_KEY, ошибка принадлежит workspace ключа, а не обязательно Pro или Max. Смотрите API key vs subscription billing и Claude Code API configuration.
Почему usage есть, а запрос заблокирован
Лимиты часто работают как rolling buckets. Длинный context давит на input tokens, длинный answer давит на output tokens, много коротких запросов давят на RPM, а резкий рост нагрузки может сработать как acceleration control. Поэтому покупка большего плана не является первым решением.
Как исправить следующий запрос
Меняйте только одну переменную: ограничьте workers, добавьте retry budget, снизьте max output, поставьте очередь, логируйте request_id, владельца маршрута, model, workspace, region, retry-after и reset values. Повтор должен идти на том же маршруте.
Если команда одновременно меняет prompt, модель, gateway и число workers, диагноз теряется. Сначала зафиксируйте failing route и сравните три события: последний успешный запрос, первый отказ и текущий отказ. Ищите, что изменилось: request rate, input tokens, output tokens, region, project, tenant, model или credential. Такой журнал превращает общее ощущение "Claude ограничивает нас" в проверяемую гипотезу.
Для production-клиента полезно добавить два счетчика еще до следующего инцидента: лимит параллельных запросов по маршруту и лимит ожидаемых output tokens по задаче. Первый счетчик защищает RPM, второй снижает давление на OTPM. Если оба значения записаны рядом с request_id, команда быстрее поймет, какой контроллер сработал и нужно ли ждать окно, менять форму запроса или просить увеличение лимита.
Отдельно сохраняйте решение оператора: почему команда ждала, снижала concurrency, уменьшала output или шла к провайдеру. Через неделю именно эта короткая заметка объяснит, почему выбранный fix был безопасным, а не случайным обходом. Это особенно важно для ночных инцидентов и последующего разбора.
Provider или gateway
Если Claude вызывается через Bedrock, Vertex AI или gateway, Anthropic Console может быть не владельцем ошибки. Ищите evidence в provider quota, project/location limits, gateway logs и tenant policy.
Пакет для эскалации
Эскалируйте после одного повтора на том же маршруте. Приложите exact message, timestamp, request_id, headers, model, workspace/project/region, владельца маршрута, status-page result и минимальный запрос. Не отправляйте ключи, токены и пользовательские данные.
Для прямого API важнее всего request_id и headers. Для Bedrock или Vertex AI важнее quota page, project, region и service account. Для gateway важны tenant key, upstream route и policy, которая сработала. Чем точнее выбран владелец, тем меньше вероятность, что support вернет вас к другому провайдеру. Если у вас нет request_id, отправьте точное время, регион, модель, размер запроса и одно воспроизведение; это все равно лучше, чем письмо "rate limit reached, помогите". Для Claude.ai также укажите тип плана, текст reset, размер текущего чата, файлы, tools и было ли включено extra usage.

Часто задаваемые вопросы
Это всегда direct API 429?
Нет. Нужно доказать владельца маршрута.
Нужно ли менять API key?
Нет, не первым шагом. Сначала подтвердите активный route.
Почему quota еще есть?
Потому что monthly usage и rolling RPM/token/burst window разные.
Что если status page зеленая?
Продолжайте проверку route: headers, /status, provider quota или gateway logs.
Когда писать в support?
Когда same-route retry снова падает и пакет evidence готов.
