Coste de tokens de Codex CLI: estima el gasto diario de API antes de una tarea larga

AI Free API Team

•23 may 2026•13 min de lectura•Herramientas de desarrollo con IA

Codex CLI no tiene un número diario universal de tokens. Comprueba la ruta activa, separa input, cached input y output, aplica precios actuales y fija un límite.

Coste de tokens de Codex CLI: estima el gasto diario de API antes de una tarea larga

A fecha de 23 de mayo de 2026, Codex CLI no tiene un número diario universal de tokens. Antes de calcular dinero, tienes que saber si la sesión usa inicio de sesión de ChatGPT, una API key, una tarea en la nube de Codex, code review o fast mode. Solo cuando el trabajo se factura con API key tiene sentido estimar el gasto con input tokens, cached input tokens y output tokens. La estimación útil empieza por la ruta, sigue con la fórmula y termina con un límite diario antes de lanzar una tarea larga.

Estimador rápido en dos minutos

Úsalo antes de pedir a Codex que recorra un repositorio grande, haga una migración de muchos archivos, depure durante horas o produzca explicaciones largas.

Confirma la ruta: ChatGPT sign-in, API key, CLI local, cloud task, code review o fast mode.
Si la facturación por API key está activa, elige el modelo real y abre la tabla actual de OpenAI Platform.
Separa tres contadores: input tokens, cached input tokens y output tokens.
Multiplica cada contador por su precio por millón de tokens.
Define un límite blando y un límite duro para el día.

La fórmula de API key es:

text
coste diario de API =
  input_tokens / 1,000,000 * input_price
+ cached_input_tokens / 1,000,000 * cached_input_price
+ output_tokens / 1,000,000 * output_price

Con los precios estándar de OpenAI revisados el 23 de mayo de 2026, un día normal con 3M input, 2M cached input y 0.4M output sale a unos 4.20 dólares en gpt-5.4-mini o 14.00 dólares en gpt-5.4. No es una promesa de factura; es un ensayo de presupuesto con supuestos visibles.

Qué medidor está activo

Separación de rutas y medidores de facturación de Codex CLI

No calcules dólares hasta saber qué medidor manda. Codex puede parecer un solo producto en la terminal, pero la ruta de facturación cambia por debajo.

Ruta activa	Qué significa	Cómo estimar	Dónde comprobar
ChatGPT sign-in	Uso de Codex ligado a un plan de ChatGPT	Included usage, credits y límites de cuenta	Codex Settings, `/status`
Facturación con API key	CLI local o automatización en OpenAI Platform	Input, cached input y output por modelo	OpenAI Platform Usage
Cloud task o code review	Infraestructura alojada de Codex	Detalles de tarea y Codex pricing	Task summary, Codex Settings
Fast mode	Trabajo más rápido en ruta ChatGPT con mayor consumo de credits	Credits y multiplicador actual	Codex Settings, speed docs

La documentación de Codex authentication trata el inicio con API key como OpenAI Platform billing a tarifas estándar de API. La página de Codex pricing describe por separado planes de ChatGPT, credits y disponibilidad de API key. Si aún estás eligiendo ruta, usa primero Codex API Key vs Subscription: Which Route Should You Use?.

Precios actuales que debes usar

Para API key importan tres precios: input, cached input y output. Output suele dominar cuando Codex escribe explicaciones largas, archivos completos, logs de test o resúmenes repetidos.

Modelo	Input	Cached input	Output	Uso en la estimación
gpt-5.4-mini	$0.75 / 1M	$0.075 / 1M	$4.50 / 1M	Base de bajo coste para tareas rutinarias
gpt-5.4	$2.50 / 1M	$0.25 / 1M	$15.00 / 1M	Estimación para diagnóstico complejo y arquitectura
gpt-5.5	$5.00 / 1M	$0.50 / 1M	$30.00 / 1M	Hay precio de Platform, pero no lo uses como base de Codex API-key sin verlo en Codex docs

La nota sobre GPT-5.5 no es decorativa. En esta revisión, Codex pricing mostraba GPT-5.5 para uso de Codex en planes ChatGPT, pero no como fila base de API key. Si OpenAI cambia esa disponibilidad, actualiza primero la ruta y luego los ejemplos.

Los precios se verifican en OpenAI Platform pricing. Los límites RPM, RPD, TPM, TPD, IPM y spend limits se verifican en API rate limits. Los límites importan para automatización, pero no son el coste diario.

Escenarios diarios de coste

Escenarios diarios de coste API para Codex CLI

Los escenarios sirven para crear un techo, no para adivinar la factura exacta.

Escenario	Input tokens	Cached input tokens	Output tokens	gpt-5.4-mini	gpt-5.4
Día ligero	0.6M	0.2M	0.08M	$0.83	$2.75
Día normal	3M	2M	0.4M	$4.20	$14.00
Día pesado	12M	8M	2M	$18.60	$62.00

El día normal en gpt-5.4-mini:

text
(3 * $0.75) + (2 * $0.075) + (0.4 * $4.50) = $4.20

La misma mezcla en gpt-5.4:

text
(3 * $2.50) + (2 * $0.25) + (0.4 * $15.00) = $14.00

La diferencia muestra que el modelo y la longitud de salida pesan más que recortar unas líneas de prompt. Para documentación, cambios pequeños, tests sencillos y diagnóstico inicial, empieza por el modelo más barato que pueda completar el trabajo con seguridad.

Cómo medir tu propio día de Codex

La mejor estimación sale de un bloque real de 30 a 60 minutos. No necesitas telemetría perfecta para tomar una decisión mejor.

Usa la misma ruta que usarás en el trabajo real.
Ejecuta una tarea representativa, no una prueba de juguete.
Registra modelo, tamaño del repositorio, rutas leídas, archivos tocados, tool calls y turnos.
Si usas API key, revisa OpenAI Platform Usage.
Si el panel separa categorías, anota input, cached input y output.
Si solo ves gasto total, crea un rango aproximado con el precio del modelo.
Normaliza el bloque al número de bloques esperados en el día y añade 25-50% por retries.

Si un bloque de 45 minutos cuesta 2 dólares, cuatro bloques no deben presupuestarse como exactamente 8 dólares. Los tests fallidos, archivos adicionales y explicaciones largas pueden empujar el output, así que conviene mirar un rango de 10 a 12 dólares antes de seguir.

Qué aumenta el consumo de tokens

Codex gasta más cuando tiene que leer más, recordar más, probar más o escribir más.

Factor	Qué ocurre	Control de coste
Contexto grande	Más archivos entran en input	Limita rutas y excluye generated files, logs y fixtures
Tool calls repetidos	Cada lectura, test y log añade contexto	Da criterios de aceptación y agrupa comprobaciones
Output largo	Explicaciones, archivos completos y logs encarecen la sesión	Pide patches, comandos y conclusiones breves
Poco cache reuse	El contexto repetido no siempre obtiene precio cached	Mantén contexto estable y evita reinicios innecesarios
Muchos retries	Tests fallidos crean más turnos	Define stop conditions antes de empezar
Modelo fuerte por defecto	La tarifa alta multiplica cada categoría	Escala modelo solo cuando haga falta

El ahorro suele ser operativo: menos alcance, salida más corta, menos reinicios, modelo base más barato y una regla de parada escrita.

Suscripción, credits o API key

La ruta correcta depende del trabajo.

Trabajo	Ruta inicial	Motivo
Codificación personal interactiva	ChatGPT sign-in	Included usage y credits encajan con esa superficie
Automatización local con informes	API key	Platform Usage y budgets son más gobernables
CI, tareas programadas, SDK o backend	API key	Necesitas credenciales no interactivas y presupuesto de proyecto
Cloud task o code review	ChatGPT / workspace route	No se estima solo con matemáticas de CLI local
Included usage agotado	Credits o esperar reset	Credits pueden ampliar uso soportado, no pagar facturas API-key ordinarias

Para límites generales de planes usa OpenAI Codex Usage Limits: Plus, Pro 5x/20x, Business Credits, and API Key Rules. Este artículo mantiene un alcance más estrecho: calcular el sobre diario cuando el trabajo local de Codex se factura por API key.

Reglas de parada para ejecuciones largas

Lista de reglas de parada presupuestaria para Codex CLI

Una sesión larga necesita una regla de parada antes que más contexto.

Límite blando: pausa al llegar al 70% del presupuesto diario.
Límite duro: usa Platform budgets o project spend limits si hay API key.
Límite de alcance: pausa si Codex pide leer fuera de las rutas acordadas.
Límite de salida: pausa si la respuesta se convierte en prosa larga en vez de patches y decisiones.
Límite de retries: pausa tras fallos repetidos y cambia de diagnóstico.

Ejemplo práctico:

text
Budget: $15/day for routine Codex CLI API-key work
Pause at: $10.50 estimated or observed usage
Default model: gpt-5.4-mini
Escalation: gpt-5.4 only for hard diagnosis or architecture change
Output rule: patch and decision first

No es una cantidad universal. Es una plantilla para decidir el número, la ruta, el modelo base y la regla de escalado antes de que la sesión crezca.

Si la factura sale más alta de lo esperado

Diagnostica en este orden:

Ruta: ¿Codex usaba API key cuando esperabas ChatGPT sign-in?
Modelo: ¿se usó una opción más cara que la estimada?
Output: ¿hubo explicaciones largas, archivos completos o resúmenes repetidos?
Contexto: ¿leyó todo el repositorio en vez de las rutas objetivo?
Retries: ¿los tests fallidos crearon muchos turnos extra?
Automatización: ¿CI o un script ejecutó el flujo varias veces?
Límites: ¿rate limits o spend limits provocaron fallos y reintentos?

OpenAI Platform Usage es el libro mayor para API-key spend. Codex Settings y /status son la comprobación para ChatGPT-route usage. Si no coinciden con tu expectativa, detén el siguiente trabajo largo y corrige la ruta.

Preguntas frecuentes

¿Cuántos tokens usa Codex CLI al día?

No existe un número universal. Depende de ruta, modelo, contexto del repositorio, archivos leídos, tool calls, longitud de output, retries, cache reuse y duración.

¿Cómo estimo el coste de API de Codex CLI?

Confirma primero que la facturación por API key está activa. Luego estima input tokens, cached input tokens y output tokens, multiplica cada categoría por el precio actual del modelo y suma.

¿Por qué separar cached input?

Porque tiene otra tarifa. Puede reducir el coste de contexto repetido, pero no convierte todo el input en precio cached automáticamente.

¿API key es más barata que ChatGPT Plus o Pro?

Depende. API key puede ser mejor para automatización controlada y reporting; ChatGPT sign-in puede ser mejor para trabajo personal interactivo con included usage.

¿Los credits de ChatGPT pagan facturas API-key?

No lo asumas. Credits pertenecen a la experiencia Codex en ruta ChatGPT; API-key usage pertenece a OpenAI Platform billing.

¿Cuál es la forma más segura de empezar una tarea larga?

Confirma la ruta, elige modelo base, limita contexto, pide output breve, mide un bloque representativo y pausa al 70% del presupuesto.

Estimador rápido en dos minutos

Úsalo antes de pedir a Codex que recorra un repositorio grande, haga una migración de muchos archivos, depure durante horas o produzca explicaciones largas.

1. Confirma la ruta: ChatGPT sign-in, API key, CLI local, cloud task, code review o fast mode. 2. Si la facturación por API key está activa, elige el modelo real y abre la tabla actual de OpenAI Platform. 3. Separa tres contadores: input tokens, cached input tokens y output tokens. 4. Multiplica cada contador por su precio por millón de tokens. 5. Define un límite blando y un límite duro para el día.

La fórmula de API key es:

Con los precios estándar de OpenAI revisados el 23 de mayo de 2026, un día normal con 3M input, 2M cached input y 0.4M output sale a unos 4.20 dólares en gpt-5.4-mini o 14.00 dólares en gpt-5.4. No es una promesa de factura; es un ensayo de presupuesto con supuestos visibles.

Qué medidor está activo

No calcules dólares hasta saber qué medidor manda. Codex puede parecer un solo producto en la terminal, pero la ruta de facturación cambia por debajo.

Precios actuales que debes usar

Para API key importan tres precios: input, cached input y output. Output suele dominar cuando Codex escribe explicaciones largas, archivos completos, logs de test o resúmenes repetidos.

Escenarios diarios de coste

Los escenarios sirven para crear un techo, no para adivinar la factura exacta.

El día normal en gpt-5.4-mini:

La misma mezcla en gpt-5.4:

Cómo medir tu propio día de Codex

La mejor estimación sale de un bloque real de 30 a 60 minutos. No necesitas telemetría perfecta para tomar una decisión mejor.

1. Usa la misma ruta que usarás en el trabajo real. 2. Ejecuta una tarea representativa, no una prueba de juguete. 3. Registra modelo, tamaño del repositorio, rutas leídas, archivos tocados, tool calls y turnos. 4. Si usas API key, revisa OpenAI Platform Usage. 5. Si el panel separa categorías, anota input, cached input y output. 6. Si solo ves gasto total, crea un rango aproximado con el precio del modelo. 7. Normaliza el bloque al número de bloques esperados en el día y añade 25-50% por retries.

Qué aumenta el consumo de tokens

Codex gasta más cuando tiene que leer más, recordar más, probar más o escribir más.

El ahorro suele ser operativo: menos alcance, salida más corta, menos reinicios, modelo base más barato y una regla de parada escrita.

Suscripción, credits o API key

La ruta correcta depende del trabajo.

Reglas de parada para ejecuciones largas

Una sesión larga necesita una regla de parada antes que más contexto.

- Límite blando: pausa al llegar al 70% del presupuesto diario. - Límite duro: usa Platform budgets o project spend limits si hay API key. - Límite de alcance: pausa si Codex pide leer fuera de las rutas acordadas. - Límite de salida: pausa si la respuesta se convierte en prosa larga en vez de patches y decisiones. - Límite de retries: pausa tras fallos repetidos y cambia de diagnóstico.

Ejemplo práctico:

No es una cantidad universal. Es una plantilla para decidir el número, la ruta, el modelo base y la regla de escalado antes de que la sesión crezca.

Si la factura sale más alta de lo esperado

Diagnostica en este orden:

1. Ruta: ¿Codex usaba API key cuando esperabas ChatGPT sign-in? 2. Modelo: ¿se usó una opción más cara que la estimada? 3. Output: ¿hubo explicaciones largas, archivos completos o resúmenes repetidos? 4. Contexto: ¿leyó todo el repositorio en vez de las rutas objetivo? 5. Retries: ¿los tests fallidos crearon muchos turnos extra? 6. Automatización: ¿CI o un script ejecutó el flujo varias veces? 7. Límites: ¿rate limits o spend limits provocaron fallos y reintentos?

OpenAI Platform Usage es el libro mayor para API-key spend. Codex Settings y /status son la comprobación para ChatGPT-route usage. Si no coinciden con tu expectativa, detén el siguiente trabajo largo y corrige la ruta.

Preguntas frecuentes

¿Cuántos tokens usa Codex CLI al día?

No existe un número universal. Depende de ruta, modelo, contexto del repositorio, archivos leídos, tool calls, longitud de output, retries, cache reuse y duración.

¿Cómo estimo el coste de API de Codex CLI?

Confirma primero que la facturación por API key está activa. Luego estima input tokens, cached input tokens y output tokens, multiplica cada categoría por el precio actual del modelo y suma.

¿Por qué separar cached input?

Porque tiene otra tarifa. Puede reducir el coste de contexto repetido, pero no convierte todo el input en precio cached automáticamente.

¿API key es más barata que ChatGPT Plus o Pro?

Depende. API key puede ser mejor para automatización controlada y reporting; ChatGPT sign-in puede ser mejor para trabajo personal interactivo con included usage.

¿Los credits de ChatGPT pagan facturas API-key?

No lo asumas. Credits pertenecen a la experiencia Codex en ruta ChatGPT; API-key usage pertenece a OpenAI Platform billing.

¿Cuál es la forma más segura de empezar una tarea larga?

Confirma la ruta, elige modelo base, limita contexto, pide output breve, mide un bloque representativo y pausa al 70% del presupuesto.

#OpenAI Codex#Codex CLI#API Pricing#Token Cost#OpenAI API#Herramientas de IA