По состоянию на 23 мая 2026 года у Codex CLI нет универсального числа токенов в день. Сначала нужно понять, через какой маршрут работает сессия: вход ChatGPT, API-ключ, облачная задача Codex, code review или fast mode. Только если активен API-ключ, имеет смысл считать деньги через input tokens, cached input tokens и output tokens. Практичная оценка начинается с маршрута, затем переходит к формуле и заканчивается дневным лимитом, после которого длинный запуск надо остановить и пересчитать.
Быстрая оценка за две минуты
Перед большим рефакторингом, длинной отладкой или задачей, где Codex будет много читать и писать, используйте короткую процедуру. Она не заменяет счёт, но показывает, безопасно ли продолжать.
- Проверьте маршрут: ChatGPT sign-in, API key, локальный CLI, cloud task, code review или fast mode.
- Если активен API key, выберите фактическую модель и откройте текущую таблицу OpenAI Platform.
- Разделите токены на input, cached input и output.
- Умножьте каждую категорию на свою цену за миллион токенов.
- Запишите мягкий и жёсткий лимит на день до запуска длинной работы.
Формула для API-key маршрута:
textdaily API cost = input_tokens / 1,000,000 * input_price + cached_input_tokens / 1,000,000 * cached_input_price + output_tokens / 1,000,000 * output_price
При ценах OpenAI, проверенных 23 мая 2026 года, обычный день с 3M input, 2M cached input и 0.4M output получается примерно $4.20 на gpt-5.4-mini или $14.00 на gpt-5.4. Это не прогноз счёта, а расчёт с видимыми допущениями.
Какой счётчик активен

Самая дорогая ошибка — считать, что ChatGPT included usage покрывает локальную работу через API key. В терминале всё выглядит как Codex, но платёжная система может быть другой.
| Маршрут | Что означает | Чем оценивать | Где проверять |
|---|---|---|---|
| ChatGPT sign-in | Работа Codex внутри плана ChatGPT | Included usage, credits и лимиты аккаунта | Codex Settings, /status |
| API-key billing | Локальный CLI или автоматизация через OpenAI Platform | Input, cached input и output цены | OpenAI Platform Usage |
| Cloud task или code review | Хостed Codex, не только локальная CLI-математика | Детали задачи и актуальные Codex docs | Task summary, Codex Settings |
| Fast mode | Быстрый ChatGPT-route с более быстрым расходом credits | Credits и текущий множитель | Codex Settings, speed docs |
Документация Codex authentication описывает API-key sign-in как OpenAI Platform billing по стандартным API rates. Страница Codex pricing отдельно описывает планы ChatGPT, credits и доступность API-key. Если выбор маршрута ещё не решён, сначала откройте соседний разбор: Codex API Key vs Subscription: Which Route Should You Use?.
Цены, которые нужно использовать сейчас
Для API-key оценки важны три цены: input, cached input и output. Output часто становится главным множителем, когда Codex пишет длинные объяснения, большие diff, логи тестов или повторные summaries.
| Model | Input | Cached input | Output | Роль в оценке |
|---|---|---|---|---|
| gpt-5.4-mini | $0.75 / 1M | $0.075 / 1M | $4.50 / 1M | Нижняя оценка для рутинных задач |
| gpt-5.4 | $2.50 / 1M | $0.25 / 1M | $15.00 / 1M | Оценка для сложной диагностики и архитектуры |
| gpt-5.5 | $5.00 / 1M | $0.50 / 1M | $30.00 / 1M | Цена Platform существует, но не используйте как baseline Codex API-key без подтверждения в Codex docs |
Оговорка по GPT-5.5 важна. В проверке этого запуска Codex pricing упоминал GPT-5.5 для ChatGPT-plan usage, но не показывал его в API-key строке Codex. Если это изменится, сначала обновите доступность модели, потом примеры.
Официальная цена берётся из OpenAI Platform pricing. Ограничения RPM, RPD, TPM, TPD, IPM и spend limits проверяются в API rate limits. Лимиты влияют на автоматизацию, но не заменяют денежную оценку.
Дневные сценарии расходов

Сценарии нужны для верхней границы. Небольшой запрос по двум файлам и миграция по всему репозиторию не имеют одинакового token mix.
| Сценарий | Input tokens | Cached input tokens | Output tokens | gpt-5.4-mini | gpt-5.4 |
|---|---|---|---|---|---|
| Лёгкий день | 0.6M | 0.2M | 0.08M | $0.83 | $2.75 |
| Обычный день | 3M | 2M | 0.4M | $4.20 | $14.00 |
| Тяжёлый день | 12M | 8M | 2M | $18.60 | $62.00 |
Обычный день на gpt-5.4-mini:
text(3 * $0.75) + (2 * $0.075) + (0.4 * $4.50) = $4.20
Тот же набор токенов на gpt-5.4:
text(3 * $2.50) + (2 * $0.25) + (0.4 * $15.00) = $14.00
Разница показывает, что модель и длина ответа важнее, чем экономия пары строк в prompt. Для обычных правок, документации, маленьких тестов и первичной диагностики начинайте с более дешёвой подходящей модели.
Как измерить свой день Codex
Лучший расчёт строится на измеренном рабочем блоке. Возьмите 30-60 минут той же работы, которую планируете масштабировать.
- Используйте тот же маршрут, что и в реальном запуске.
- Выберите настоящую задачу, а не игрушечный prompt.
- Запишите модель, размер репозитория, затронутые пути, команды, tool calls и число итераций.
- Если активен API key, откройте OpenAI Platform Usage.
- Если видны категории токенов, разделите input, cached input и output.
- Если видна только сумма, постройте диапазон по цене модели.
- Умножьте блок на число похожих блоков за день и добавьте 25-50% на retries.
Этот метод полезен даже без идеальной телеметрии. Если 45-минутный блок уже стоит $2, четыре таких блока не стоит бюджетировать как ровно $8: тесты, дополнительные файлы и длинные объяснения быстро добавят output.
Что сильнее всего сжигает токены
Codex расходует больше, когда должен больше читать, помнить, пробовать и писать.
| Причина | Что происходит | Контроль стоимости |
|---|---|---|
| Большой контекст репозитория | Много файлов попадает в input | Ограничьте пути, исключите generated files, logs, fixtures |
| Повторные tool calls | Каждое чтение, тест и лог увеличивают контекст | Дайте acceptance criteria и попросите batch-проверки |
| Длинный output | Объяснения, полные файлы и логи стоят дороже | Просите diff, команды и короткие выводы |
| Низкий cache reuse | Похожие данные не всегда попадают в cached input | Держите контекст стабильным, не перезапускайте без причины |
| Много retries | Проваленные тесты создают новые turn | Заранее задайте stop condition |
| Сильная модель по умолчанию | Цена множится на все категории | Эскалируйте модель только для действительно сложного случая |
Обычно экономия выглядит скучно: уже scope, короче output, меньше перезапусков, дешевле baseline model и ясная граница остановки. Это надёжнее, чем искать единую дневную норму токенов.
Подписка, credits или API key
Маршрут выбирается по задаче, а не по названию продукта.
| Задача | Первый выбор | Почему |
|---|---|---|
| Личная интерактивная разработка | ChatGPT sign-in | Included usage и credits подходят этому интерфейсу |
| Локальная автоматизация с отчётностью | API key | Platform Usage и budgets проще контролировать |
| CI, scheduled jobs, SDK, backend | API key | Нужны non-interactive credentials и project budgets |
| Cloud tasks или code review | ChatGPT / workspace route | Не считайте hosted work только локальной CLI формулой |
| Included usage закончился | Credits или ожидание reset | Credits могут расширить supported usage, но не являются обычным API-key балансом |
За общими лимитами планов идите в соседнюю статью: OpenAI Codex Usage Limits: Plus, Pro 5x/20x, Business Credits, and API Key Rules. Здесь граница уже: дневная API-cost оценка для локальной работы через API key.
Бюджетные правила остановки

Длинной сессии сначала нужен stop rule, потом дополнительный контекст.
- Мягкий лимит: остановиться на 70% дневного бюджета.
- Жёсткий лимит: включить Platform budgets или project spend limit.
- Scope limit: остановиться, если Codex просит читать файлы вне согласованной области.
- Output limit: остановиться, если ответы превращаются в длинную прозу вместо patch, commands, decisions.
- Retry limit: остановиться после повторяющихся тестовых или командных циклов.
Пример:
textBudget: $15/day for routine Codex CLI API-key work Pause at: $10.50 estimated or observed usage Default model: gpt-5.4-mini Escalation: gpt-5.4 only for hard diagnosis or architecture change Output rule: concise patch and decision first
Это не универсальная рекомендация по сумме. Это формат, который заставляет принять решение до того, как сессия станет дорогой.
Если счёт неожиданно высокий
Диагностика идёт в таком порядке:
- Маршрут: не оказался ли API key активным вместо ChatGPT sign-in?
- Модель: не использовалась ли более дорогая модель?
- Output: не писал ли агент длинные explanations, full files или logs?
- Context: не читал ли весь репозиторий?
- Retries: не зациклились ли тесты?
- Automation: не запускал ли CI тот же процесс несколько раз?
- Limits: не вызвали ли rate или spend limits дополнительные retry?
OpenAI Platform Usage является ledger для API-key расходов. Codex Settings и /status показывают ChatGPT-route состояние. Если эти поверхности не совпадают с ожиданием, остановите задачу и исправьте маршрут.
Часто задаваемые вопросы
Сколько токенов в день использует Codex CLI?
Единого числа нет. День зависит от маршрута, модели, контекста репозитория, прочитанных файлов, tool calls, длины output, retries, cache reuse и длительности работы.
Как оценить стоимость Codex CLI через API?
Сначала подтвердите API-key billing. Затем оцените input, cached input и output tokens, умножьте каждую категорию на текущую цену модели и сложите.
Почему cached input считается отдельно?
Потому что cached input имеет другую цену. Он может удешевить повторяющийся контекст, но не означает, что весь input автоматически считается по cache rate.
API key дешевле ChatGPT Plus или Pro?
Не всегда. API key хорош для контролируемой автоматизации и отчётности; подписка часто лучше для интерактивной личной работы с included usage.
Credits ChatGPT покрывают API-key счета?
Не исходите из этого. Credits относятся к ChatGPT-route Codex experience, а API-key usage относится к OpenAI Platform billing.
Как безопасно начать длинный запуск?
Проверьте маршрут, задайте модель, ограничьте paths, попросите краткий output, измерьте sample block и остановитесь на 70% бюджета.
