No reintentes a ciegas. Primero decide si el propietario es Anthropic API directo, Claude Code, proveedor, gateway o un bucket de burst.
| Surface | Owner | First move | Proof | Next step |
|---|---|---|---|---|
| Direct Anthropic API | Anthropic workspace | Wait by retry-after and reduce shape | HTTP 429 and rate-limit headers | Retry one smaller same-route request |
| Claude Code API key | API key workspace | Check /status and credential route | Claude Code status plus API logs | Lower Code API traffic or inspect Console |
| Claude Code plan | Subscription or session window | Do not start with API headers | Plan or period wording | Use the Claude Code limit guide |
| Bedrock or Vertex AI | Cloud project | Open provider quota | Provider 429 or throttling | Change provider quota or region |
| Gateway | Gateway tenant | Read gateway logs | Tenant or upstream policy | Adjust gateway limit or contact operator |
| Burst | Traffic shape | Queue and slow ramp | RPS or concurrency spike | Verify the same route |
La regla de parada es clara: no cambies key, plan, proveedor ni modelo antes de probar el propietario. Si cambias la ruta, el error original deja de ser verificable.
Primero identifica la ruta que produjo el limite
La frase rate limit reached no prueba por si sola que se agoto un unico bucket de Anthropic API. Una llamada directa a api.anthropic.com se verifica con HTTP 429, cuerpo de respuesta y headers. Claude Code puede usar ANTHROPIC_API_KEY y entonces el dueno es el workspace del key; una sesion de suscripcion tiene otra ventana. Bedrock, Vertex AI y un gateway pueden devolver texto parecido aunque el limite viva en el proyecto, region, tenant policy o upstream.
Haz tres preguntas: que credencial proceso la llamada, que dashboard gobierna esa credencial y si puedes reproducir una vez en la misma ruta sin cambiar modelo, provider, prompt ni region.

Si la linea realmente es Claude Code 500, 529 o una ventana de plan, usa Claude Code 500/529/rate limit router. Para el caso especifico de Claude Code rate limit, ve a Claude Code rate limit.
Anthropic API directo: confia en los headers
En Anthropic API directo, HTTP 429 corresponde a rate_limit_error. La evidencia util es retry-after, la familia anthropic-ratelimit, RPM, input tokens per minute y output tokens per minute. Puede quedar presupuesto mensual y aun asi agotarse una ventana corta.
El siguiente request debe ser mas pequeno y lento: reduce concurrencia, baja max output, divide jobs largos, usa cache para contexto estable y reintenta una sola vez en la misma ruta.

Claude Code: revisa active route antes de cambiar planes
En Claude Code, /status y la ruta de credenciales importan. Si ANTHROPIC_API_KEY esta activo, el fallo puede pertenecer al workspace del API key, no a Pro o Max. Consulta API key vs subscription billing y Claude Code API configuration.
Por que hay usage disponible y aun asi falla
Los rate limits suelen ser rolling buckets. Un contexto largo presiona input tokens, una respuesta larga presiona output tokens, muchos requests pequenos presionan RPM y una subida brusca puede activar acceleration control.
Arregla el siguiente request sin crear ruido
Cambia una variable por vez. Agrega backoff con jitter, limita workers, baja max output, usa una cola y registra request_id, propietario de ruta, model, workspace, region, retry-after y reset headers. Verifica en la misma ruta, credencial y modelo.
Si el equipo cambia prompt, modelo, gateway y numero de workers al mismo tiempo, pierde la senal. Congela la ruta fallida y compara tres eventos: el ultimo request correcto, el primer rechazo y el rechazo actual. Busca que cambio: request rate, input tokens, output tokens, region, project, tenant, model o credencial. Ese registro convierte una sospecha general en una prueba operable.
En produccion conviene dejar dos limites propios antes del siguiente incidente: un maximo de workers por ruta y un presupuesto de output tokens por tarea. El primero protege RPM; el segundo reduce presion sobre OTPM. Cuando esos valores quedan junto al request_id, el equipo sabe si debe esperar la ventana, cambiar la forma del request o pedir mas capacidad al propietario correcto.
Limites de provider o gateway
Con Bedrock, Vertex AI o gateway, Anthropic Console puede no ser el dueno. Revisa provider quota, project/location limits, gateway logs y tenant policy antes de abrir un caso con Anthropic.
Paquete de escalacion
Escala despues de una reproduccion en la misma ruta. Incluye exact message, timestamp, request_id, headers, model, workspace/project/region, propietario de ruta, resultado de status y request minimo. No envies keys, tokens ni datos personales.
Para API directo, request_id y headers son la prueba central. Para Bedrock o Vertex AI, importan project, region y quota page. Para gateway, importan tenant, upstream route y policy hit. Si envias el paquete al propietario correcto, evitas una ronda completa de soporte que solo te devuelve al otro proveedor.

Preguntas frecuentes
Siempre es un 429 directo de Anthropic API?
No. Primero prueba el propietario de la ruta.
Debo rotar el API key?
No como primer paso. Puede ocultar la evidencia original.
Por que queda usage disponible?
Porque monthly usage y rolling RPM/token/burst windows no son lo mismo.
Que hago si Claude Status esta verde?
Sigue con la evidencia de la ruta: headers, /status, provider dashboard o gateway logs.
Cuando contacto support?
Cuando una reproduccion en la misma ruta vuelve a fallar y el paquete de evidencia esta listo.
