Codex CLI 토큰 비용: 긴 실행 전에 하루 API 지출 추정하기

AI Free API Team

•2026년 5월 23일•13 분 소요•AI 개발 도구

Codex CLI에는 공통으로 적용되는 하루 토큰 수가 없습니다. 먼저 청구 라우트를 확인하고 토큰 구성, 모델 가격, 예산 상한으로 API-key 지출을 추정하세요.

2026년 5월 23일 기준으로 Codex CLI에는 누구에게나 맞는 하루 토큰 수가 없습니다. 먼저 현재 세션이 ChatGPT 로그인, API key, Codex 클라우드 작업, code review, fast mode 중 어느 라우트인지 확인해야 합니다. API-key 청구가 활성화된 경우에만 input tokens, cached input tokens, output tokens를 나누어 API 비용을 계산합니다. 긴 실행 전에 가장 안전한 순서는 라우트 확인, 공식 가격 적용, 일일 예산 상한 설정입니다.

2분 안에 쓰는 비용 추정 절차

큰 저장소 수정, 여러 파일 리팩터링, 긴 디버깅, 테스트 로그 분석을 시작하기 전에 이 절차를 먼저 사용하세요. 실제 청구서를 예측하는 도구는 아니지만, 계속 진행해도 되는지 판단하는 기준을 줍니다.

라우트를 확인합니다: ChatGPT 로그인, API key, 로컬 CLI, 클라우드 작업, code review, fast mode.
API-key 청구라면 실제 모델과 현재 OpenAI Platform 가격을 확인합니다.
토큰을 input, cached input, output 세 종류로 나눕니다.
각 종류를 100만 토큰 단가로 곱합니다.
긴 작업을 시작하기 전에 하루 소프트 상한과 하드 상한을 적어둡니다.

API-key 라우트의 기본 공식은 다음과 같습니다.

text
일일 API 비용 =
  input_tokens / 1,000,000 * input_price
+ cached_input_tokens / 1,000,000 * cached_input_price
+ output_tokens / 1,000,000 * output_price

2026년 5월 23일에 확인한 OpenAI 표준 텍스트 가격으로 보면, 3M input, 2M cached input, 0.4M output을 쓰는 보통 날은 gpt-5.4-mini 약 4.20달러, gpt-5.4 약 14.00달러입니다. 이 수치는 청구 보장이 아니라 가정이 보이는 예산 연습입니다.

현재 활성화된 청구 미터 확인

Codex CLI 라우트와 청구 미터 분리

비용 사고는 공식보다 라우트 착각에서 더 자주 생깁니다. 터미널에서는 같은 Codex처럼 보여도 실제 청구 표는 다를 수 있습니다.

라우트	의미	추정 기준	확인 위치
ChatGPT 로그인	ChatGPT 플랜 안의 Codex 사용	included usage, credits, 계정별 한도	Codex Settings, `/status`
API-key 청구	OpenAI Platform을 통한 로컬 CLI 또는 자동화	input, cached input, output 가격	OpenAI Platform Usage
클라우드 작업/code review	호스팅된 Codex 흐름	작업 상세와 Codex pricing docs	Task summary, Codex Settings
fast mode	ChatGPT 라우트에서 더 빠르지만 credits 소모도 빠름	credits와 현재 배수	Codex Settings, speed docs

Codex authentication은 API-key sign-in을 OpenAI Platform billing으로 설명합니다. Codex pricing은 ChatGPT 플랜 사용량, credits, API-key availability를 별도로 다룹니다. 따라서 ChatGPT included usage가 API-key 청구를 자동으로 덮는다고 보면 안 됩니다.

라우트 자체가 고민이라면 먼저 Codex API Key vs Subscription: Which Route Should You Use?를 읽으세요. API-key 비용을 추정할 때는 먼저 청구 라우트를 확정한 뒤 계산으로 넘어가야 합니다.

현재 가격 기준을 분리해서 적용

API-key 비용에서 중요한 값은 input, cached input, output입니다. Codex가 긴 설명, 큰 diff, 테스트 로그, 반복 요약을 많이 쓰면 output이 비용을 키웁니다.

Model	Input	Cached input	Output	추정에서의 역할
gpt-5.4-mini	$0.75 / 1M	$0.075 / 1M	$4.50 / 1M	일반 작업의 저비용 기준
gpt-5.4	$2.50 / 1M	$0.25 / 1M	$15.00 / 1M	어려운 진단과 설계 판단 기준
gpt-5.5	$5.00 / 1M	$0.50 / 1M	$30.00 / 1M	Platform 가격은 있지만 Codex API-key 기준으로 쓰려면 Codex docs 확인 필요

GPT-5.5의 경계는 중요합니다. 이번 확인 시점에서 Codex pricing은 ChatGPT-plan Codex usage에 GPT-5.5를 보여주었지만, API-key 행의 기준 모델로는 표시하지 않았습니다. 앞으로 바뀐다면 예시 숫자보다 먼저 라우트 지원 여부를 갱신해야 합니다.

가격은 OpenAI Platform pricing을 기준으로 합니다. RPM, RPD, TPM, TPD, IPM, spend limit은 API rate limits에서 확인합니다. 한도는 자동화 실행 가능성을 좌우하지만 하루 비용 공식 자체는 아닙니다.

일일 시나리오로 예산 상한 만들기

Codex CLI API 비용 일일 시나리오

작은 두 파일 수정과 저장소 전체 마이그레이션은 같은 토큰 구성을 갖지 않습니다. 먼저 작업일을 light, normal, heavy로 나누고 모델별 차이를 봅니다.

시나리오	Input tokens	Cached input tokens	Output tokens	gpt-5.4-mini	gpt-5.4
가벼운 날	0.6M	0.2M	0.08M	$0.83	$2.75
보통 날	3M	2M	0.4M	$4.20	$14.00
무거운 날	12M	8M	2M	$18.60	$62.00

보통 날을 gpt-5.4-mini로 계산하면 다음과 같습니다.

text
(3 * $0.75) + (2 * $0.075) + (0.4 * $4.50) = $4.20

같은 토큰 구성을 gpt-5.4에 적용하면 다음과 같습니다.

text
(3 * $2.50) + (2 * $0.25) + (0.4 * $15.00) = $14.00

차이가 작지 않습니다. 모델 선택과 출력 길이는 프롬프트 몇 줄을 줄이는 것보다 비용에 더 크게 작용합니다. 문서 수정, 작은 버그, 기본 테스트, 초반 조사에는 먼저 저비용 모델을 쓰고, 정말 어려운 진단에서만 올리는 편이 낫습니다.

내 작업 기준으로 측정하기

가장 좋은 추정은 내 워크플로에서 나온 30-60분 샘플입니다. 완벽한 텔레메트리가 없어도 장시간 실행을 계속할지 멈출지 판단할 수 있습니다.

실제 작업과 같은 라우트를 사용합니다.
장난감 프롬프트가 아니라 대표 작업을 고릅니다.
모델, 저장소 크기, 읽은 경로, 수정 파일, tool calls, 대화 턴 수를 기록합니다.
API key라면 OpenAI Platform Usage를 확인합니다.
가능하면 input, cached input, output을 분리합니다.
총액만 보이면 모델 가격으로 범위를 역산합니다.
하루에 같은 블록이 몇 번 반복될지 곱하고 retry 버퍼 25-50%를 더합니다.

예를 들어 45분 샘플이 2달러라면, 네 번 반복한다고 단순히 8달러로 잡지 마세요. 실패한 테스트, 추가 파일 확인, 긴 설명이 output을 늘릴 수 있으므로 10-12달러 범위를 먼저 보수적으로 잡는 편이 안전합니다.

토큰을 더 태우는 요인

Codex는 더 많이 읽고, 기억하고, 시도하고, 쓸수록 토큰을 사용합니다.

요인	실제 현상	비용 제어
큰 저장소 문맥	많은 파일이 input으로 들어감	대상 경로를 좁히고 generated files, logs, fixtures 제외
반복 tool calls	read, test, log, summary가 계속 쌓임	acceptance criteria를 주고 관련 확인을 묶게 함
긴 output	설명, 전체 파일, 로그, 반복 요약이 비싸짐	patch, 명령, 짧은 결론을 우선 요청
낮은 cache reuse	비슷한 문맥도 cached input 가격이 아닐 수 있음	문맥을 안정적으로 유지하고 불필요한 재시작을 줄임
높은 retry 수	실패 테스트가 새로운 turn을 만듦	중단 조건과 검증 명령을 먼저 제시
강한 모델 기본값	모든 토큰 범주에 높은 단가 적용	필요한 순간에만 모델을 올림

절약은 화려하지 않습니다. 범위를 줄이고, 출력 길이를 통제하고, 재실행을 줄이고, 저렴한 기준 모델을 선택하고, 멈출 조건을 쓰는 것이 가장 확실합니다.

구독, credits, API key 선택

작업 성격에 따라 라우트를 골라야 합니다.

작업	먼저 볼 라우트	이유
개인 대화형 코딩	ChatGPT 로그인	included usage와 credits가 이 표면에 맞음
로컬 자동화와 사용량 보고	API key	Platform Usage와 project budgets를 관리하기 쉬움
CI, scheduled jobs, SDK, backend	API key	비대화형 credential과 프로젝트 예산 필요
클라우드 작업/code review	ChatGPT / workspace 라우트	로컬 CLI 공식만으로는 hosted work 추정 불가
included usage 소진	credits 또는 reset 대기	credits는 지원된 사용을 늘릴 수 있지만 일반 API-key 잔액은 아님

전체 플랜 한도는 OpenAI Codex Usage Limits: Plus, Pro 5x/20x, Business Credits, and API Key Rules를 보세요. 여기서는 API-key로 청구되는 로컬 Codex 작업의 일일 비용 범위만 다룹니다.

긴 실행을 위한 예산 중단 규칙

긴 Codex CLI 실행을 위한 예산 중단 규칙

긴 세션에는 더 많은 문맥보다 먼저 중단 규칙이 필요합니다.

소프트 상한: 하루 예산의 70%에 도달하면 멈춥니다.
하드 상한: API key 프로젝트에는 Platform budgets 또는 spend limit을 둡니다.
범위 상한: 약속한 경로 밖의 파일을 읽기 시작하면 멈춥니다.
출력 상한: 구체적 diff 대신 긴 설명이 반복되면 멈춥니다.
retry 상한: 같은 테스트 실패가 반복되면 새 진단으로 전환합니다.

예시는 다음과 같습니다.

text
Budget: $15/day for routine Codex CLI API-key work
Pause at: $10.50 estimated or observed usage
Default model: gpt-5.4-mini
Escalation: gpt-5.4 only for hard diagnosis or architecture change
Output rule: patch and decision first

이 금액이 모두에게 맞는 추천은 아닙니다. 중요한 것은 금액, 라우트, 기본 모델, 모델 상향 조건을 작업 전에 정하는 것입니다.

예상보다 높은 청구서를 만났을 때

추측하지 말고 순서대로 확인하세요.

라우트: ChatGPT 로그인이라고 생각했지만 API key를 쓰고 있지 않았나요?
모델: 추정보다 비싼 모델이 사용되지 않았나요?
Output: 긴 설명, 전체 파일, 로그, 반복 요약을 많이 만들지 않았나요?
Context: 대상 경로 대신 저장소 전체를 읽지 않았나요?
Retries: 실패한 테스트가 많은 turn을 만들지 않았나요?
Automation: CI나 script가 같은 흐름을 여러 번 실행하지 않았나요?
Limits: rate 또는 spend limit이 실패와 retry를 유발하지 않았나요?

API-key 지출의 원장은 OpenAI Platform Usage입니다. ChatGPT 라우트는 Codex Settings와 /status에서 확인합니다. 기대와 다르면 다음 긴 실행을 시작하기 전에 라우트를 바로잡아야 합니다.

자주 묻는 질문

Codex CLI는 하루에 토큰을 얼마나 쓰나요?

공통 숫자는 없습니다. 라우트, 모델, 저장소 문맥, 읽은 파일, tool calls, output 길이, retry, cache reuse, 작업 시간에 따라 달라집니다.

Codex CLI API 비용은 어떻게 계산하나요?

먼저 API-key 청구가 활성인지 확인합니다. 그다음 input tokens, cached input tokens, output tokens를 나누고 각 범주에 현재 모델 가격을 곱해 합산합니다.

cached input은 왜 따로 계산하나요?

단가가 다르기 때문입니다. cached input은 반복 문맥을 낮은 가격으로 만들 수 있지만 모든 input이 자동으로 cache 가격이 되는 것은 아닙니다.

API key가 ChatGPT Plus나 Pro보다 항상 싼가요?

아닙니다. 통제된 저용량 자동화에는 API key가 맞을 수 있고, 긴 대화형 개인 작업에는 included usage가 있는 ChatGPT 로그인이 더 나을 수 있습니다.

ChatGPT credits가 API-key 청구를 결제하나요?

그렇게 가정하지 마세요. credits는 ChatGPT 라우트의 Codex 경험에 속하고, API-key usage는 OpenAI Platform billing입니다.

긴 Codex CLI 작업을 안전하게 시작하려면?

라우트를 확인하고, 기본 모델을 정하고, 문맥을 제한하고, 짧은 output을 요청하고, 대표 샘플을 측정하고, 예산의 70%에서 멈추는 규칙을 적고 시작하세요.

2분 안에 쓰는 비용 추정 절차

1. 라우트를 확인합니다: ChatGPT 로그인, API key, 로컬 CLI, 클라우드 작업, code review, fast mode. 2. API-key 청구라면 실제 모델과 현재 OpenAI Platform 가격을 확인합니다. 3. 토큰을 input, cached input, output 세 종류로 나눕니다. 4. 각 종류를 100만 토큰 단가로 곱합니다. 5. 긴 작업을 시작하기 전에 하루 소프트 상한과 하드 상한을 적어둡니다.

API-key 라우트의 기본 공식은 다음과 같습니다.

2026년 5월 23일에 확인한 OpenAI 표준 텍스트 가격으로 보면, 3M input, 2M cached input, 0.4M output을 쓰는 보통 날은 gpt-5.4-mini 약 4.20달러, gpt-5.4 약 14.00달러입니다. 이 수치는 청구 보장이 아니라 가정이 보이는 예산 연습입니다.

현재 활성화된 청구 미터 확인

비용 사고는 공식보다 라우트 착각에서 더 자주 생깁니다. 터미널에서는 같은 Codex처럼 보여도 실제 청구 표는 다를 수 있습니다.

현재 가격 기준을 분리해서 적용

API-key 비용에서 중요한 값은 input, cached input, output입니다. Codex가 긴 설명, 큰 diff, 테스트 로그, 반복 요약을 많이 쓰면 output이 비용을 키웁니다.

일일 시나리오로 예산 상한 만들기

작은 두 파일 수정과 저장소 전체 마이그레이션은 같은 토큰 구성을 갖지 않습니다. 먼저 작업일을 light, normal, heavy로 나누고 모델별 차이를 봅니다.

보통 날을 gpt-5.4-mini로 계산하면 다음과 같습니다.

같은 토큰 구성을 gpt-5.4에 적용하면 다음과 같습니다.

내 작업 기준으로 측정하기

가장 좋은 추정은 내 워크플로에서 나온 30-60분 샘플입니다. 완벽한 텔레메트리가 없어도 장시간 실행을 계속할지 멈출지 판단할 수 있습니다.

1. 실제 작업과 같은 라우트를 사용합니다. 2. 장난감 프롬프트가 아니라 대표 작업을 고릅니다. 3. 모델, 저장소 크기, 읽은 경로, 수정 파일, tool calls, 대화 턴 수를 기록합니다. 4. API key라면 OpenAI Platform Usage를 확인합니다. 5. 가능하면 input, cached input, output을 분리합니다. 6. 총액만 보이면 모델 가격으로 범위를 역산합니다. 7. 하루에 같은 블록이 몇 번 반복될지 곱하고 retry 버퍼 25-50%를 더합니다.

토큰을 더 태우는 요인

Codex는 더 많이 읽고, 기억하고, 시도하고, 쓸수록 토큰을 사용합니다.

구독, credits, API key 선택

작업 성격에 따라 라우트를 골라야 합니다.

긴 실행을 위한 예산 중단 규칙

긴 세션에는 더 많은 문맥보다 먼저 중단 규칙이 필요합니다.

- 소프트 상한: 하루 예산의 70%에 도달하면 멈춥니다. - 하드 상한: API key 프로젝트에는 Platform budgets 또는 spend limit을 둡니다. - 범위 상한: 약속한 경로 밖의 파일을 읽기 시작하면 멈춥니다. - 출력 상한: 구체적 diff 대신 긴 설명이 반복되면 멈춥니다. - retry 상한: 같은 테스트 실패가 반복되면 새 진단으로 전환합니다.

예시는 다음과 같습니다.

이 금액이 모두에게 맞는 추천은 아닙니다. 중요한 것은 금액, 라우트, 기본 모델, 모델 상향 조건을 작업 전에 정하는 것입니다.

예상보다 높은 청구서를 만났을 때

추측하지 말고 순서대로 확인하세요.

1. 라우트: ChatGPT 로그인이라고 생각했지만 API key를 쓰고 있지 않았나요? 2. 모델: 추정보다 비싼 모델이 사용되지 않았나요? 3. Output: 긴 설명, 전체 파일, 로그, 반복 요약을 많이 만들지 않았나요? 4. Context: 대상 경로 대신 저장소 전체를 읽지 않았나요? 5. Retries: 실패한 테스트가 많은 turn을 만들지 않았나요? 6. Automation: CI나 script가 같은 흐름을 여러 번 실행하지 않았나요? 7. Limits: rate 또는 spend limit이 실패와 retry를 유발하지 않았나요?

API-key 지출의 원장은 OpenAI Platform Usage입니다. ChatGPT 라우트는 Codex Settings와 /status에서 확인합니다. 기대와 다르면 다음 긴 실행을 시작하기 전에 라우트를 바로잡아야 합니다.

자주 묻는 질문

Codex CLI는 하루에 토큰을 얼마나 쓰나요?

공통 숫자는 없습니다. 라우트, 모델, 저장소 문맥, 읽은 파일, tool calls, output 길이, retry, cache reuse, 작업 시간에 따라 달라집니다.

Codex CLI API 비용은 어떻게 계산하나요?

먼저 API-key 청구가 활성인지 확인합니다. 그다음 input tokens, cached input tokens, output tokens를 나누고 각 범주에 현재 모델 가격을 곱해 합산합니다.

cached input은 왜 따로 계산하나요?

단가가 다르기 때문입니다. cached input은 반복 문맥을 낮은 가격으로 만들 수 있지만 모든 input이 자동으로 cache 가격이 되는 것은 아닙니다.

API key가 ChatGPT Plus나 Pro보다 항상 싼가요?

아닙니다. 통제된 저용량 자동화에는 API key가 맞을 수 있고, 긴 대화형 개인 작업에는 included usage가 있는 ChatGPT 로그인이 더 나을 수 있습니다.

ChatGPT credits가 API-key 청구를 결제하나요?

그렇게 가정하지 마세요. credits는 ChatGPT 라우트의 Codex 경험에 속하고, API-key usage는 OpenAI Platform billing입니다.

긴 Codex CLI 작업을 안전하게 시작하려면?

#OpenAI Codex#Codex CLI#API 가격#Token 비용#OpenAI API#AI 개발 도구