Перейти к основному содержанию

Гайд по использованию токенов в Claude Code: как отслеживать, снижать и планировать лимиты (2026)

A
19 мин чтенияClaude Code

У Claude Code нет одной универсальной шкалы расхода. На Pro и Max он использует общий 5-часовой и недельный лимит вместе с Claude на вебе, десктопе и мобильных устройствах. В API-режиме расход измеряется через RPM, входные TPM, выходные TPM и лимиты затрат. Этот материал объясняет, почему Claude Code расходует лимиты так быстро, как отслеживать это через `/status` и `/cost`, и как сократить расход, не ломая рабочий процесс.

Гайд по использованию токенов в Claude Code: как отслеживать, снижать и планировать лимиты (2026)

Claude Code кажется дорогим по другой причине, чем обычный чат: он не просто отвечает, а постоянно тащит вперед контекст, файлы, результаты инструментов и вывод модели внутри агентного цикла. Вам кажется, что вы отправили одну короткую просьбу в терминале, а инструмент уже успел прочитать код, запустить команды, проверить результат и снова унести все это в следующую итерацию. Самая частая путаница возникает из-за слова «usage»: сейчас оно больше не означает один простой счетчик. Если вы вошли через Pro или Max, Claude Code расходует общий лимит вместе с Claude на вебе, десктопе и мобильных устройствах и измеряется через 5-часовые сессии и недельные ограничения. Если в окружении есть ANTHROPIC_API_KEY или вы переключились на pay-as-you-go, Claude Code внезапно начинает жить как API-трафик с RPM, входными TPM, выходными TPM и лимитами расходов. Как только вы разделяете эти две системы, большая часть загадки исчезает.

Этот гайд опирается на публично подтверждаемые данные по состоянию на 2 апреля 2026 года. Он объясняет, как сейчас реально считается расход в Claude Code, почему он уходит быстрее обычного чата, как смотреть его через Settings > Usage, /status и /cost, и какие оптимизации остаются полезными после недавних обновлений Anthropic. Цель не в том, чтобы дать очередную таблицу «примерно сколько часов в неделю», которая устареет через месяц. Цель в том, чтобы дать рабочую модель: в вашей ситуации нужно сжимать контекст, менять модель, включать extra usage или переводить тяжелый спринт на API-биллинг.

Коротко

  • У Claude Code нет одной универсальной шкалы расхода. На Pro и Max нужно думать о 5-часовых сессиях и недельных лимитах; в API-режиме нужно думать о RPM, входных TPM, выходных TPM и лимитах расходов.
  • Главный драйвер расхода обычно не число промптов, а размер контекста. Чем больше файлов, длиннее сессия, тяжелее tool loop, шире MCP-слой и дороже модель, тем быстрее уходит лимит.
  • Для пользователей Pro и Max главные ориентиры сейчас Settings > Usage и /status. Для понимания того, почему конкретная сессия резко подорожала, нужен /cost.
  • Sonnet 4.6 и Opus 4.6 в Claude Code могут использовать окно до 1M токенов, но на платных планах это связано с новыми правилами доступа и extra usage. Большое окно полезно только тогда, когда оно действительно нужно.
  • Самая быстрая экономия обычно приходит не от «меньше спрашивать», а от чистых сессий, своевременного /compact, выбора Sonnet или Haiku по умолчанию и уменьшения объема того, что Claude должен читать перед действием.
  • Если расход кажется нелогичным, сначала проверьте путь биллинга: вы могли незаметно уйти на API через ANTHROPIC_API_KEY, использовать не ту модель или работать в период более жесткого пикового ограничения.

Что сейчас на самом деле означает “usage” в Claude Code

Схема, показывающая как расход Claude Code делится между лимитами плана и API-биллингом

Главная ошибка большинства статей и обсуждений в том, что они говорят о расходе Claude Code так, будто это одна квота. На практике Anthropic сейчас показывает две разные системы учета, и Claude Code может переходить между ними в зависимости от способа аутентификации.

Если вы используете подписку Pro или Max, Claude Code тратит тот же общий пул, что и Claude на вебе, десктопе и мобильных устройствах. В актуальном help center Anthropic прямо отправляет пользователей в Settings > Usage, где показываются и текущий 5-часовой лимит сессии, и недельные лимиты. Именно так сейчас нужно думать о расходе на личных подписках. Поэтому старые статьи с языком про «дневную квоту», «точное число промптов» или «стабильное число часов в неделю» сейчас куда менее надежны, чем кажутся. Тот же help center также явно проговаривает, что Claude и Claude Code делят один пул usage, а после исчерпания включенного лимита у вас остаются три пути: ждать сброса, включать extra usage или переходить на pay-as-you-go через Console.

Если вы используете Claude Code через API key, учет меняется полностью. В API-документации Anthropic расход выражается через requests per minute, input tokens per minute и output tokens per minute, плюс накладываются лимиты затрат по tier. Для API-пользователя ключевой вопрос звучит не «сколько осталось от плана?», а «в какой bucket я уткнулся?». Можно иметь деньги в Console и все равно упереться в ITPM или RPM.

Есть еще один особенно неприятный источник путаницы. Anthropic прямо предупреждает: если в окружении задан ANTHROPIC_API_KEY, Claude Code будет аутентифицироваться через него, а не через вашу Pro/Max-подписку. В результате человек думает, что расходует включенный usage плана, а на деле уже генерирует API-расходы. Когда кто-то говорит «Claude Code слишком быстро сжег мои токены», первым делом нужно проверять не число токенов, а путь биллинга.

Поэтому более полезная модель такая: пользователь Pro/Max управляет сессионным и недельным лимитом, пользователь API управляет пропускной способностью и бюджетом. Ощущение похоже, потому что в обеих системах вас в какой-то момент останавливают. Но рычаги разные. Подписка решается через 5-часовые окна, weekly limits, extra usage и время суток. API решается через RPM, ITPM, OTPM, кэш и лимиты расходов. Когда эти поверхности смешивают в одну, Claude Code и начинает казаться мистикой.

Почему Claude Code расходует токены быстрее обычного чата

Схема, показывающая как контекст, вызовы инструментов, выбор модели и длинные сессии увеличивают расход Claude Code

Claude Code ощущается дороже обычного чата по одной простой причине: это не одноходовый чат в терминале, а агентный инструмент, который многократно загружает контекст, вызывает инструменты, читает файлы, предлагает правки, проверяет результат и нередко повторяет этот цикл несколько раз.

Главный фактор здесь — накопление контекста. В актуальном cost guide Anthropic это сформулировано прямо: стоимость растет вместе с размером контекста. В кодовых задачах эта логика проявляется сильнее, чем в обычном чате. Каждый новый файл, каждый кусок старой переписки и каждое определение MCP-инструмента делают следующий ход тяжелее. Сессия, которая кажется удобной, потому что «все остается в одном треде», к концу нередко превращается в самый дорогой способ работать, потому что каждый новый запрос тащит за собой все больше прошлого.

Второй фактор — интенсивная работа инструментов. Claude Code ценен именно тем, что он не только отвечает. Он ищет, читает, редактирует, запускает команды и проверяет вывод. Поэтому фраза «исправь этот баг» в веб-чате и та же фраза внутри Claude Code — совершенно разные по стоимости действия. Вы видите один запрос, но внутри могло произойти несколько model/tool итераций, и каждая из них несет с собой контекст.

Третий фактор — маршрут модели и размер доступного окна контекста. Anthropic в актуальных help-статьях говорит, что платные планы Claude обычно работают с окном 200K, но Sonnet 4.6 и Opus 4.6 в Claude Code могут доходить до 1M. На API-стороне Anthropic отдельно пишет, что Sonnet 4.6 и Opus 4.6 принимают 1M токенов, тогда как другие модели остаются ближе к 200K+. Большое окно — это не бесплатная магия. Оно просто позволяет включить больше контекста. Если вы включаете больше без разбора, расход просто растет быстрее.

Четвертый фактор — фоновая стоимость, которую вы почти не замечаете. Документация Claude Code теперь отдельно подчеркивает, что prompt caching помогает повторно использовать стабильный контекст, auto-compaction сокращает историю по мере роста треда, а некоторые фоновые функции все равно потребляют небольшое число токенов. Anthropic описывает этот фон как небольшой расход, обычно меньше $0.04 за сессию, но важен не абсолютный размер, а сам принцип: usage в Claude Code никогда не равен только тому, сколько текста вы напечатали руками.

Вот почему фраза «я отправил всего несколько промптов» вообще плохо помогает судить о стоимости. Важны не промпты сами по себе, а размер репозитория, длина сессии, активная модель, глубина tool loop и то, заставляете ли вы Claude каждый раз заново читать то, что можно было сузить заранее.

Как смотреть usage без гадания

Если статья про usage советует «примерно прикинуть по ощущениям», она бесполезна. У Anthropic уже есть несколько конкретных способов увидеть происходящее, но они разбросаны по разным поверхностям.

Для подписчиков Pro и Max главным внешним окном остается Settings > Usage. Anthropic пишет, что верхняя часть интерфейса показывает и текущий 5-часовой usage, и недельные лимиты, и время сброса. В самом Claude Code help-страницы рекомендуют команду /status как самый быстрый способ увидеть оставшееся распределение. Если вы хотите оставаться внутри плана и не скатываться в API-биллинг, начинать тяжелую задачу без /status — плохая привычка.

Если вам нужно понять почему именно эта сессия внезапно стала дорогой, важнее команда /cost. В актуальном cost guide Anthropic именно она названа основным способом смотреть токенный расход внутри Claude Code. Это особенно важно, когда вопрос стоит не «сколько осталось от полоски плана?», а «почему именно сейчас стоимость пошла вверх?». Документация также говорит, что стоимость можно вынести в status line. Для ежедневного использования Claude Code это почти обязательная настройка.

Для Team, Enterprise и Console пользователей Anthropic уже запустил более полноценный слой Claude Code analytics: активность, принятие подсказок, число принятых строк кода, расходы и adoption-метрики. Но help center одновременно прямо уточняет: для индивидуальных Pro и Max analytics сейчас нет. Поэтому популярный совет «просто откройте usage dashboard» для личных подписок сегодня не работает.

Практический стек сейчас выглядит так:

ВопросЛучший инструмент
Сколько осталось от Pro / Max?Settings > Usage и /status
Почему именно эта сессия резко подорожала?/cost и вывод стоимости в status line
Как команда использует Claude Code в целом?Claude Code analytics для Team / Enterprise / Console
В какой API bucket я уперся?429-ответы, retry-after и лимиты в Console

Если брать только один новый навык, пусть это будет этот: перестаньте судить о расходе Claude Code по интуиции. Смотрите /status перед крупной задачей и /cost по ходу работы. Это надежнее почти любой публичной таблицы с «примерными часами в неделю».

Какая модель цен и лимитов сейчас действительно важна

Сравнение путей доступа к Claude Code: Pro, Max и API-биллинг

На апрель 2026 года Anthropic довольно четко формулирует цену подписок, но намного осторожнее говорит о точной вместимости этих планов. Поэтому здесь полезно разделять публично объявленную цену и непубличную реальную емкость.

На стороне личных подписок страница pricing говорит, что Pro стоит $20 в месяц при помесячной оплате или $17 в пересчете на месяц при годовой, и прямо указывает, что Pro включает Claude Code и Claude Cowork. Max начинается от $100 в месяц и дает 5x или 20x usage по сравнению с Pro, а также более высокий output ceiling и приоритет в периоды большой нагрузки. Это и есть стабильный официальный контракт. Он надежнее любых сторонних оценок про то, сколько часов или промптов «обычно» хватает на каждом плане. Если ваша главная задача — понять не поведение сессий, а именно выбор между планами, наши сравнение Claude Code Pro vs Max и гайд по Claude Code pricing разбирают эту часть глубже.

На стороне API-биллинга Anthropic публикует точные цены по токенам. По состоянию на 2 апреля 2026 года pricing page показывает Sonnet 4.6 по $3 за миллион входных токенов и $15 за миллион выходных, Opus 4.6 по $5 / $25, а Haiku 4.5 по $1 / $5. Prompt caching тарифицируется отдельно, а batch processing по-прежнему рекламируется как скидка 50%. Для разработчиков, которые запускают короткие, но тяжелые автоматизации, именно API-единица стоимости часто оказывается важнее маркетинговых описаний планов.

Ключевой источник практической ясности — это таблица API-tier, потому что она позволяет отличить проблему скорости от проблемы бюджета:

API tierПорог пополненияRPMSonnet ITPMSonnet OTPM
Tier 1$55030,0008,000
Tier 2$401,000450,00090,000
Tier 3$2002,000800,000160,000
Tier 4$4004,0002,000,000400,000

Эти значения взяты напрямую из актуальной документации Anthropic по API rate limits. На той же странице отдельно отмечено, что для большинства моделей cache reads не засчитываются в ITPM. Отсюда и возникает ощущение, что хороший кэш может работать как бесплатный апгрейд tier.

История с окном контекста тоже сейчас сложнее, чем в старых статьях. Help center Anthropic говорит, что для платных планов Claude базовым ориентиром остается 200K контекста, но Sonnet 4.6 и Opus 4.6 в Claude Code могут использовать 1M. На стороне API Anthropic отдельно подтверждает 1M для Sonnet 4.6 и Opus 4.6, тогда как другие модели остаются в диапазоне 200K+. Практический вывод здесь один: большее окно полезно только как точный инструмент, а не как ленивый режим по умолчанию.

Как это переводится в выбор пути? Если вам нужен относительно предсказуемый ежемесячный расход и вы пользуетесь Claude Code тяжело, но не без остановки весь день, Pro или Max плюс extra usage обычно остаются самым чистым вариантом. Если вы живете в режиме burst automation, агентных задач, командных workflow или просто хотите видеть стоимость по единице работы, API-биллинг обычно проще считать и ограничивать. Плохая привычка — думать, что любой usage-перегрев автоматически лечится более дорогим планом. Нередко вам нужен просто более чистый сеанс.

Семь способов снизить расход Claude Code без потери скорости

Лучшая оптимизация — не та, которая заставляет пользоваться Claude Code реже, а та, которая не дает Claude делать лишнюю работу.

1. Очищайте старый контекст между несвязанными задачами. Anthropic прямо рекомендует /clear, когда вы переходите к другой задаче, потому что устаревший контекст съедает токены в каждом следующем сообщении. Для тяжелых пользователей это самый сильный рычаг. Если нужно сохранить тред, переименуйте его и позже вернитесь через /resume. Ошибка — тащить в одну героическую сессию весь рабочий день.

2. Делайте compact до того, как тред раздуется. Anthropic также рекомендует /compact и даже позволяет задавать инструкции к compaction в CLAUDE.md. Это правильный ход, когда задача остается связанной, но разговор уже распух. Хороший compact-подход конкретен: сохранить гипотезу текущего бага, измененные файлы и оставшиеся падения тестов. Не заставляйте Claude догадываться, что важно.

3. Смотрите /cost, а не только на свои ощущения. Если вы смотрите на стоимость только тогда, когда уже раздражены, вы смотрите слишком поздно. Во время сессии периодически проверяйте /cost, а при постоянном использовании вынесите cost в status line.

4. По умолчанию оставайтесь на Sonnet, а к Haiku обращайтесь чаще, чем подсказывает эго. Cost guide Anthropic прямо говорит, что Sonnet закрывает большинство кодовых задач и стоит дешевле Opus, а Haiku подходит для более простых подзадач. На практике это значит, что форматирование, пояснения, небольшие рефакторинги и локальные правки не должны автоматически уходить на самый дорогой маршрут. Opus стоит оставлять для архитектуры, сложной отладки и реальных многошаговых рассуждений.

5. Снижайте MCP и discovery-overhead. Документация Claude Code пишет, что MCP-определения откладываются по умолчанию, а /context помогает увидеть, что занимает место. Там же советуют отдавать предпочтение CLI-инструментам, если они есть, потому что они часто экономичнее по контексту, чем тяжелые MCP-инвентари. Если задачу можно решить через git, gh, rg или облачный CLI, это часто дешевле.

6. Делайте так, чтобы Claude читал меньше до начала работы. Anthropic рекомендует плагины code intelligence для типизированных языков: точная навигация по символам сокращает лишние чтения файлов. В документации также упоминаются hooks и skills как способ предварительно отфильтровать или объяснить контекст, прежде чем Claude его загрузит. Это одна из самых недооцененных оптимизаций. Если вы снова и снова скармливаете большие логи, полный test output или один и тот же этап discovery, проблема не в тарифе, а в слабой предобработке.

7. Выбирайте правильную модель оплаты под конкретную неделю. В актуальных help-статьях Pro/Max Anthropic уже прямо указывает два официальных выхода, когда включенного usage не хватает: extra usage и pay-as-you-go. Для разовой миграции, недели массовых агентных задач или очень тяжелого рефакторинга это зачастую разумнее, чем пытаться любой ценой втиснуться в обычный monthly plan.

Общая логика за всеми семью пунктами одна: сужайте контекст, осознанно выбирайте модели и не заставляйте Claude заново изучать то, что уже можно было структурировать заранее.

Что делать, если usage все равно кажется неправильным

Хороший usage-гайд должен объяснять не только нормальную модель, но и ситуации, когда ощущение расхода действительно может не совпадать с ожиданием.

Первая ситуация — путаница с аутентификацией. Если в окружении есть API key, Claude Code может работать по API-биллингу, а не по подписке. С точки зрения пользователя это выглядит как «Claude Code внезапно слишком быстро жрет токены». На самом деле могла просто незаметно смениться платежная поверхность.

Вторая ситуация — динамическое поведение лимитов. В конце марта 2026 года GitHub issues, обсуждения на Reddit и статьи в техпрессе описывали случаи, когда 5-часовой usage заканчивался подозрительно быстро, а в пиковые часы ограничения ощущались жестче. Help center Anthropic уже публично признает 5-часовые и недельные лимиты, но не публикует совершенно стабильную таблицу всех динамических изменений. Самый безопасный вывод здесь такой: старые статические оценки слабее текущих живых индикаторов продукта. Когда опыт расходится со старой статьей, верьте текущим Settings > Usage, /status и /cost больше, чем любой публичной оценке.

Третья ситуация — слишком тяжелый маршрут по контексту включен по умолчанию. Вокруг 1M-контекста сейчас много путаницы. Официальные страницы Anthropic действительно подтверждают 1M для Sonnet 4.6 и Opus 4.6 в Claude Code, но это не означает, что любой маршрут с большим окном всегда будет вести себя одинаково в любой момент. Если usage внезапно стал заметно хуже, сначала проверьте самые простые объяснения: меньшая модель, меньший контекст, новая сессия, отсутствие случайного API-key-маршрута и влияние времени суток.

Если вам нужен не общий mental model, а конкретная инструкция по ошибке, переходите к нашему гайду по ошибке Claude Code “Rate limit reached”. Эта статья отвечает на вопрос «почему так происходит», а та — на вопрос «как быстро вернуть рабочее состояние».

Частые вопросы

Есть ли у Claude Code отдельный лимит от Claude на вебе?

Для индивидуальных планов Pro и Max — нет. Anthropic прямо пишет, что usage общий между Claude и Claude Code. Если вы используете API-биллинг, это уже отдельная система со своими лимитами и расходами.

1M контекст в Claude Code доступен всегда?

Нет. Текущие help-страницы Anthropic говорят, что платные планы Claude обычно работают с 200K, а Sonnet 4.6 и Opus 4.6 могут использовать 1M в Claude Code при соответствующих условиях. На API-стороне Anthropic отдельно подтверждает 1M для Sonnet 4.6 и Opus 4.6. Не стоит превращать наличие 1M в привычку тащить в сессию лишнее.

Есть ли Claude Code analytics на личном Pro или Max?

Пока нет. Статья Anthropic про usage analytics прямо говорит, что аналитика не доступна индивидуальным Pro и Max пользователям. Для личного использования остаются Settings > Usage, /status и /cost.

Помогает ли prompt caching экономить usage?

Да, но механика зависит от поверхности. В API-документации Anthropic сказано, что cache reads для большинства моделей не считаются в ITPM, что напрямую помогает throughput. В более широком usage-руководстве повторное использование стабильного контекста также считается одним из лучших способов растянуть лимит. Практический вывод одинаков: стабильный повторяющийся контекст дешевле, чем заставлять Claude каждый раз читать его заново.

Когда оставаться на Pro, когда идти в Max, а когда переходить на API?

Если Claude Code полезен, но еще не стал вашим главным рабочим двигателем на весь день, начинать с Pro обычно разумнее всего. Если в обычной работе лимиты мешают регулярно, имеет смысл Max. Если речь идет о тяжелых всплесках, автоматизации, командных пайплайнах или желании отдельно считать стоимость и throughput, API-биллинг часто становится проще и понятнее.

Почему Claude Code сначала кажется нормальным, а потом внезапно дорожает?

Потому что сессия становится тяжелее со временем. Растет история разговора, список прочитанных файлов, tool output и часто меняется сама стоимость маршрута модели. Обычно проблема не в количестве новых промптов как таковом, а в том, сколько старого контекста вы продолжаете тащить вперед.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус