Перейти к основному содержанию

Claude Rate Exceeded: как понять, чей лимит сработал

L
6 мин чтенияClaude

Claude Rate Exceeded не означает один лимит. Сначала определите поверхность, сигнал reset и владельца маршрута, затем повторяйте запрос на том же пути.

Claude Rate Exceeded: как понять, чей лимит сработал

Если Claude показывает "Rate Exceeded", "Claude Error: Rate limit reached" или строку 429 в Claude Code, не считайте это одним лимитом API. Сначала определите поверхность: Claude.ai/Desktop usage window, Claude Code через подписку, Claude Code через API key, прямой Anthropic API, Bedrock/Vertex AI, gateway или временное управление нагрузкой. У каждой ветки свой reset-сигнал и свой владелец.

SurfaceOwnerFirst moveProofNext step
Claude.ai / Desktop / mobileUsage window or capacity managementCheck Settings > Usage, reduce long chats/files, wait for shown reset5-hour, session, weekly reset, usage bars, capacity textStart a smaller chat, wait, enable extra usage if available
Claude Code subscription authPlan/session window shared with Claude surfacesRun /usage or read the reset messagesession limit, weekly limit, model limitWait, lower model/workload, or use extra usage
Claude Code API keyConsole workspace or cloud projectRun /status and confirm active credentialAPI-key route, provider logs, 429 bodyLower concurrency or inspect owner dashboard
Direct Anthropic APIAnthropic workspace/model rate limitWait by retry-after and reduce shapeHTTP 429, rate_limit_error, rate-limit headersRetry one smaller same-route request
Bedrock, Vertex AI, gatewayProvider project, region, tenant, proxy policyOpen provider/gateway logsProvider 429, throttling, tenant policyChange that quota or contact that operator
Capacity, burst, accelerationService load or traffic shapeWait briefly, check status, slow the rampCapacity text, recent incident, RPS spikeRetry later or verify a smaller same-route request

Главное правило: не меняйте ключ, тариф, провайдера или модель до проверки владельца маршрута. Если ошибка исчезла после смены маршрута, это еще не диагноз.

Сначала определите маршрут

Фраза rate limit reached не доказывает, что исчерпан один конкретный лимит Anthropic API. Прямой запрос к api.anthropic.com проверяется через HTTP 429, тело ответа и заголовки. Claude Code может идти через ANTHROPIC_API_KEY, а может идти через подписку. Bedrock, Vertex AI и gateway могут вернуть похожий текст, но владелец лимита будет в облачном проекте, регионе, tenant-policy или upstream-route.

Задайте три вопроса: какая учетная запись обработала запрос, какой dashboard владеет этой учетной записью, и можно ли воспроизвести ошибку один раз на том же маршруте без смены модели, региона, provider или prompt.

Карта веток по тексту ошибки

Если строка относится к Claude Code 500, 529 или plan window, используйте Claude Code 500/529/rate limit router. Для отдельной ветки Claude Code rate limit есть Claude Code rate limit.

Claude.ai или Desktop: сначала проверьте окно usage

Если ошибка появилась в Claude.ai, Desktop или mobile без HTTP headers, сначала считайте это лимитом product surface. Usage limits задают, сколько вы можете использовать Claude за период времени, а length limits относятся к размеру одного разговора. Длинные чаты, файлы, tools, Research, connectors и более тяжелые модели быстрее расходуют окно.

Не начинайте с API-key fix. Проверьте Settings > Usage, прочитайте reset time, начните меньший новый chat, уберите лишние файлы/tools или подождите. Capacity constraints могут быть временным управлением нагрузкой и не всегда выглядят как status-page outage.

Direct Anthropic API: доверяйте заголовкам

Для прямого Anthropic API HTTP 429 соответствует rate_limit_error. Следующий шаг задают retry-after и anthropic-ratelimit заголовки. RPM, input tokens per minute и output tokens per minute могут блокировать независимо. Остаток месячного бюджета не отменяет короткое окно.

Сделайте следующий запрос меньше: уменьшите concurrency, задайте backoff с jitter, снизьте max output, разбейте длинные задачи, кешируйте стабильный context и повторите один запрос на том же route.

Цикл header и retry

Claude Code: сначала active route

В Claude Code важно не перепутать подписку и API-key route. /status показывает активный путь. Если задан ANTHROPIC_API_KEY, ошибка принадлежит workspace ключа, а не обязательно Pro или Max. Смотрите API key vs subscription billing и Claude Code API configuration.

Почему usage есть, а запрос заблокирован

Лимиты часто работают как rolling buckets. Длинный context давит на input tokens, длинный answer давит на output tokens, много коротких запросов давят на RPM, а резкий рост нагрузки может сработать как acceleration control. Поэтому покупка большего плана не является первым решением.

Как исправить следующий запрос

Меняйте только одну переменную: ограничьте workers, добавьте retry budget, снизьте max output, поставьте очередь, логируйте request_id, владельца маршрута, model, workspace, region, retry-after и reset values. Повтор должен идти на том же маршруте.

Если команда одновременно меняет prompt, модель, gateway и число workers, диагноз теряется. Сначала зафиксируйте failing route и сравните три события: последний успешный запрос, первый отказ и текущий отказ. Ищите, что изменилось: request rate, input tokens, output tokens, region, project, tenant, model или credential. Такой журнал превращает общее ощущение "Claude ограничивает нас" в проверяемую гипотезу.

Для production-клиента полезно добавить два счетчика еще до следующего инцидента: лимит параллельных запросов по маршруту и лимит ожидаемых output tokens по задаче. Первый счетчик защищает RPM, второй снижает давление на OTPM. Если оба значения записаны рядом с request_id, команда быстрее поймет, какой контроллер сработал и нужно ли ждать окно, менять форму запроса или просить увеличение лимита.

Отдельно сохраняйте решение оператора: почему команда ждала, снижала concurrency, уменьшала output или шла к провайдеру. Через неделю именно эта короткая заметка объяснит, почему выбранный fix был безопасным, а не случайным обходом. Это особенно важно для ночных инцидентов и последующего разбора.

Provider или gateway

Если Claude вызывается через Bedrock, Vertex AI или gateway, Anthropic Console может быть не владельцем ошибки. Ищите evidence в provider quota, project/location limits, gateway logs и tenant policy.

Пакет для эскалации

Эскалируйте после одного повтора на том же маршруте. Приложите exact message, timestamp, request_id, headers, model, workspace/project/region, владельца маршрута, status-page result и минимальный запрос. Не отправляйте ключи, токены и пользовательские данные.

Для прямого API важнее всего request_id и headers. Для Bedrock или Vertex AI важнее quota page, project, region и service account. Для gateway важны tenant key, upstream route и policy, которая сработала. Чем точнее выбран владелец, тем меньше вероятность, что support вернет вас к другому провайдеру. Если у вас нет request_id, отправьте точное время, регион, модель, размер запроса и одно воспроизведение; это все равно лучше, чем письмо "rate limit reached, помогите". Для Claude.ai также укажите тип плана, текст reset, размер текущего чата, файлы, tools и было ли включено extra usage.

Пакет эскалации Claude

Часто задаваемые вопросы

Это всегда direct API 429?

Нет. Нужно доказать владельца маршрута.

Нужно ли менять API key?

Нет, не первым шагом. Сначала подтвердите активный route.

Почему quota еще есть?

Потому что monthly usage и rolling RPM/token/burst window разные.

Что если status page зеленая?

Продолжайте проверку route: headers, /status, provider quota или gateway logs.

Когда писать в support?

Когда same-route retry снова падает и пакет evidence готов.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус