Перейти к основному содержанию

Стоимость токенов Codex CLI: как оценить дневные расходы API перед долгим запуском

A
13 мин чтенияИнструменты AI-разработки

У Codex CLI нет единого числа токенов в день. Сначала проверьте маршрут, затем считайте input, cached input, output и ставьте дневной лимит.

Стоимость токенов Codex CLI: как оценить дневные расходы API перед долгим запуском

По состоянию на 23 мая 2026 года у Codex CLI нет универсального числа токенов в день. Сначала нужно понять, через какой маршрут работает сессия: вход ChatGPT, API-ключ, облачная задача Codex, code review или fast mode. Только если активен API-ключ, имеет смысл считать деньги через input tokens, cached input tokens и output tokens. Практичная оценка начинается с маршрута, затем переходит к формуле и заканчивается дневным лимитом, после которого длинный запуск надо остановить и пересчитать.

Быстрая оценка за две минуты

Перед большим рефакторингом, длинной отладкой или задачей, где Codex будет много читать и писать, используйте короткую процедуру. Она не заменяет счёт, но показывает, безопасно ли продолжать.

  1. Проверьте маршрут: ChatGPT sign-in, API key, локальный CLI, cloud task, code review или fast mode.
  2. Если активен API key, выберите фактическую модель и откройте текущую таблицу OpenAI Platform.
  3. Разделите токены на input, cached input и output.
  4. Умножьте каждую категорию на свою цену за миллион токенов.
  5. Запишите мягкий и жёсткий лимит на день до запуска длинной работы.

Формула для API-key маршрута:

text
daily API cost = input_tokens / 1,000,000 * input_price + cached_input_tokens / 1,000,000 * cached_input_price + output_tokens / 1,000,000 * output_price

При ценах OpenAI, проверенных 23 мая 2026 года, обычный день с 3M input, 2M cached input и 0.4M output получается примерно $4.20 на gpt-5.4-mini или $14.00 на gpt-5.4. Это не прогноз счёта, а расчёт с видимыми допущениями.

Какой счётчик активен

Разделение маршрутов Codex CLI и счётчиков оплаты

Самая дорогая ошибка — считать, что ChatGPT included usage покрывает локальную работу через API key. В терминале всё выглядит как Codex, но платёжная система может быть другой.

МаршрутЧто означаетЧем оцениватьГде проверять
ChatGPT sign-inРабота Codex внутри плана ChatGPTIncluded usage, credits и лимиты аккаунтаCodex Settings, /status
API-key billingЛокальный CLI или автоматизация через OpenAI PlatformInput, cached input и output ценыOpenAI Platform Usage
Cloud task или code reviewХостed Codex, не только локальная CLI-математикаДетали задачи и актуальные Codex docsTask summary, Codex Settings
Fast modeБыстрый ChatGPT-route с более быстрым расходом creditsCredits и текущий множительCodex Settings, speed docs

Документация Codex authentication описывает API-key sign-in как OpenAI Platform billing по стандартным API rates. Страница Codex pricing отдельно описывает планы ChatGPT, credits и доступность API-key. Если выбор маршрута ещё не решён, сначала откройте соседний разбор: Codex API Key vs Subscription: Which Route Should You Use?.

Цены, которые нужно использовать сейчас

Для API-key оценки важны три цены: input, cached input и output. Output часто становится главным множителем, когда Codex пишет длинные объяснения, большие diff, логи тестов или повторные summaries.

ModelInputCached inputOutputРоль в оценке
gpt-5.4-mini$0.75 / 1M$0.075 / 1M$4.50 / 1MНижняя оценка для рутинных задач
gpt-5.4$2.50 / 1M$0.25 / 1M$15.00 / 1MОценка для сложной диагностики и архитектуры
gpt-5.5$5.00 / 1M$0.50 / 1M$30.00 / 1MЦена Platform существует, но не используйте как baseline Codex API-key без подтверждения в Codex docs

Оговорка по GPT-5.5 важна. В проверке этого запуска Codex pricing упоминал GPT-5.5 для ChatGPT-plan usage, но не показывал его в API-key строке Codex. Если это изменится, сначала обновите доступность модели, потом примеры.

Официальная цена берётся из OpenAI Platform pricing. Ограничения RPM, RPD, TPM, TPD, IPM и spend limits проверяются в API rate limits. Лимиты влияют на автоматизацию, но не заменяют денежную оценку.

Дневные сценарии расходов

Дневные сценарии стоимости API для Codex CLI

Сценарии нужны для верхней границы. Небольшой запрос по двум файлам и миграция по всему репозиторию не имеют одинакового token mix.

СценарийInput tokensCached input tokensOutput tokensgpt-5.4-minigpt-5.4
Лёгкий день0.6M0.2M0.08M$0.83$2.75
Обычный день3M2M0.4M$4.20$14.00
Тяжёлый день12M8M2M$18.60$62.00

Обычный день на gpt-5.4-mini:

text
(3 * $0.75) + (2 * $0.075) + (0.4 * $4.50) = $4.20

Тот же набор токенов на gpt-5.4:

text
(3 * $2.50) + (2 * $0.25) + (0.4 * $15.00) = $14.00

Разница показывает, что модель и длина ответа важнее, чем экономия пары строк в prompt. Для обычных правок, документации, маленьких тестов и первичной диагностики начинайте с более дешёвой подходящей модели.

Как измерить свой день Codex

Лучший расчёт строится на измеренном рабочем блоке. Возьмите 30-60 минут той же работы, которую планируете масштабировать.

  1. Используйте тот же маршрут, что и в реальном запуске.
  2. Выберите настоящую задачу, а не игрушечный prompt.
  3. Запишите модель, размер репозитория, затронутые пути, команды, tool calls и число итераций.
  4. Если активен API key, откройте OpenAI Platform Usage.
  5. Если видны категории токенов, разделите input, cached input и output.
  6. Если видна только сумма, постройте диапазон по цене модели.
  7. Умножьте блок на число похожих блоков за день и добавьте 25-50% на retries.

Этот метод полезен даже без идеальной телеметрии. Если 45-минутный блок уже стоит $2, четыре таких блока не стоит бюджетировать как ровно $8: тесты, дополнительные файлы и длинные объяснения быстро добавят output.

Что сильнее всего сжигает токены

Codex расходует больше, когда должен больше читать, помнить, пробовать и писать.

ПричинаЧто происходитКонтроль стоимости
Большой контекст репозиторияМного файлов попадает в inputОграничьте пути, исключите generated files, logs, fixtures
Повторные tool callsКаждое чтение, тест и лог увеличивают контекстДайте acceptance criteria и попросите batch-проверки
Длинный outputОбъяснения, полные файлы и логи стоят дорожеПросите diff, команды и короткие выводы
Низкий cache reuseПохожие данные не всегда попадают в cached inputДержите контекст стабильным, не перезапускайте без причины
Много retriesПроваленные тесты создают новые turnЗаранее задайте stop condition
Сильная модель по умолчаниюЦена множится на все категорииЭскалируйте модель только для действительно сложного случая

Обычно экономия выглядит скучно: уже scope, короче output, меньше перезапусков, дешевле baseline model и ясная граница остановки. Это надёжнее, чем искать единую дневную норму токенов.

Подписка, credits или API key

Маршрут выбирается по задаче, а не по названию продукта.

ЗадачаПервый выборПочему
Личная интерактивная разработкаChatGPT sign-inIncluded usage и credits подходят этому интерфейсу
Локальная автоматизация с отчётностьюAPI keyPlatform Usage и budgets проще контролировать
CI, scheduled jobs, SDK, backendAPI keyНужны non-interactive credentials и project budgets
Cloud tasks или code reviewChatGPT / workspace routeНе считайте hosted work только локальной CLI формулой
Included usage закончилсяCredits или ожидание resetCredits могут расширить supported usage, но не являются обычным API-key балансом

За общими лимитами планов идите в соседнюю статью: OpenAI Codex Usage Limits: Plus, Pro 5x/20x, Business Credits, and API Key Rules. Здесь граница уже: дневная API-cost оценка для локальной работы через API key.

Бюджетные правила остановки

Бюджетные stop rules для длинного запуска Codex CLI

Длинной сессии сначала нужен stop rule, потом дополнительный контекст.

  • Мягкий лимит: остановиться на 70% дневного бюджета.
  • Жёсткий лимит: включить Platform budgets или project spend limit.
  • Scope limit: остановиться, если Codex просит читать файлы вне согласованной области.
  • Output limit: остановиться, если ответы превращаются в длинную прозу вместо patch, commands, decisions.
  • Retry limit: остановиться после повторяющихся тестовых или командных циклов.

Пример:

text
Budget: $15/day for routine Codex CLI API-key work Pause at: $10.50 estimated or observed usage Default model: gpt-5.4-mini Escalation: gpt-5.4 only for hard diagnosis or architecture change Output rule: concise patch and decision first

Это не универсальная рекомендация по сумме. Это формат, который заставляет принять решение до того, как сессия станет дорогой.

Если счёт неожиданно высокий

Диагностика идёт в таком порядке:

  1. Маршрут: не оказался ли API key активным вместо ChatGPT sign-in?
  2. Модель: не использовалась ли более дорогая модель?
  3. Output: не писал ли агент длинные explanations, full files или logs?
  4. Context: не читал ли весь репозиторий?
  5. Retries: не зациклились ли тесты?
  6. Automation: не запускал ли CI тот же процесс несколько раз?
  7. Limits: не вызвали ли rate или spend limits дополнительные retry?

OpenAI Platform Usage является ledger для API-key расходов. Codex Settings и /status показывают ChatGPT-route состояние. Если эти поверхности не совпадают с ожиданием, остановите задачу и исправьте маршрут.

Часто задаваемые вопросы

Сколько токенов в день использует Codex CLI?

Единого числа нет. День зависит от маршрута, модели, контекста репозитория, прочитанных файлов, tool calls, длины output, retries, cache reuse и длительности работы.

Как оценить стоимость Codex CLI через API?

Сначала подтвердите API-key billing. Затем оцените input, cached input и output tokens, умножьте каждую категорию на текущую цену модели и сложите.

Почему cached input считается отдельно?

Потому что cached input имеет другую цену. Он может удешевить повторяющийся контекст, но не означает, что весь input автоматически считается по cache rate.

API key дешевле ChatGPT Plus или Pro?

Не всегда. API key хорош для контролируемой автоматизации и отчётности; подписка часто лучше для интерактивной личной работы с included usage.

Credits ChatGPT покрывают API-key счета?

Не исходите из этого. Credits относятся к ChatGPT-route Codex experience, а API-key usage относится к OpenAI Platform billing.

Как безопасно начать длинный запуск?

Проверьте маршрут, задайте модель, ограничьте paths, попросите краткий output, измерьте sample block и остановитесь на 70% бюджета.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус