Перейти к основному содержанию

Paid Tier получает free_tier_requests limit 0 — полное руководство по исправлению (2026)

A
25 мин чтенияУстранение неполадок API

Получаете ошибку 429 RESOURCE_EXHAUSTED с free_tier_requests limit: 0 на платном аккаунте Gemini API? Это руководство поможет определить, вызвана ли проблема неправильной настройкой биллинга или известным багом Google, а затем проведёт вас через точное решение для каждого сценария — включая обходные пути для бага с генерацией изображений в феврале 2026 года.

Paid Tier получает free_tier_requests limit 0 — полное руководство по исправлению (2026)

Если ваш платный аккаунт Gemini API возвращает ошибку 429 RESOURCE_EXHAUSTED с метаданными quotaMetric: "generate_content_free_tier_requests" и quotaValue: "0", вы столкнулись с одной из двух совершенно разных проблем. Либо ваш Google Cloud Billing не привязан к проекту, в котором находится API-ключ, и это можно исправить менее чем за пять минут, либо вы столкнулись с известным багом платформы Google, который затрагивает модели генерации изображений примерно с 10 февраля 2026 года. По состоянию на февраль 2026 года аккаунты Tier 1 должны получать 150-300 RPM (запросов в минуту) по сравнению с 5-15 RPM бесплатного уровня, а переход с бесплатного на Tier 1 происходит мгновенно после правильной настройки Cloud Billing (ai.google.dev/gemini-api/docs/rate-limits, февраль 2026).

Краткое содержание

Ошибка «free_tier_requests limit: 0» на платных аккаунтах Gemini API имеет две основные причины. Самая распространённая из них, на которую приходится примерно 60% случаев, заключается в том, что Cloud Billing фактически не привязан к проекту GCP, связанному с вашим API-ключом. Исправление занимает пять минут: перейдите в Google Cloud Console, привяжите платёжный аккаунт к проекту, создайте новый API-ключ и проверьте повышение уровня. Вторая причина, затрагивающая около 25-40% недавних случаев, — это настоящий баг платформы Google, при котором модели генерации изображений, такие как gemini-2.5-flash-image и gemini-3-pro-image-preview, остаются на квотах бесплатного уровня, даже когда биллинг правильно настроен. Для этого сценария обходные пути включают использование текстовых моделей, которые работают корректно, миграцию на эндпоинт Vertex AI или использование стороннего прокси-сервиса API. Оставшиеся случаи связаны с API-ключами, созданными до включения биллинга, что решается простым созданием нового ключа после активации биллинга.

Что на самом деле означает «free_tier_requests limit: 0»?

Когда вы получаете ошибку 429 RESOURCE_EXHAUSTED от Gemini API, тело ответа содержит подробную информацию о квотах, которая точно указывает, что пошло не так. Ключевые поля для анализа — это quotaMetric, которое определяет, в какой квотный бакет был отнесён ваш запрос, а также quotaValue и quotaLimit, показывающие текущее использование и максимально допустимый лимит соответственно. Когда вы видите quotaMetric: "generativelanguage.googleapis.com/generate_content_free_tier_requests" с quotaValue и quotaLimit, установленными в "0", это говорит о тревожной ситуации: API считает ваш аккаунт пользователем бесплатного уровня с нулевой оставшейся квотой, независимо от того, что показывает ваша панель биллинга.

Чтобы понять, почему это происходит, нужно знать, как работает система квот Google изнутри. Gemini API применяет квоты на уровне проекта, а не на уровне отдельного API-ключа (ai.google.dev, февраль 2026). Это означает, что если у вас есть несколько API-ключей в одном проекте Google Cloud, все они разделяют один и тот же пул квот. Когда Cloud Billing привязывается к проекту, бэкенд Google должен автоматически повысить квоты этого проекта с бесплатного до платного уровня. Появление метрики «free_tier_requests» в ответе об ошибке — это наиболее явный сигнал того, что это повышение либо не произошло, либо было отменено из-за проблемы на платформе.

Существует важное различие между quotaLimit: "0" и простым превышением лимита запросов. Значение quotaLimit равное нулю означает, что система назначила вам буквально нулевую квоту — не то, что вы израсходовали весь лимит, а то, что вам его вообще не выделили. Это отличается от обычной ошибки лимита, при которой quotaLimit может показывать «5» (RPM бесплатного уровня для Gemini 2.5 Pro), а quotaValue показывает «5» (всё использовано). Сценарий с нулевой квотой конкретно указывает на проблему с биллингом или конфигурацией платформы, а не на обычное исчерпание лимита.

Чтобы определить, в какой ситуации вы находитесь, внимательно изучите полное тело ответа об ошибке. Вот как выглядит типичный JSON ошибки при нулевой квоте:

json
{ "error": { "code": 429, "message": "Resource has been exhausted", "status": "RESOURCE_EXHAUSTED", "details": [{ "reason": "RATE_LIMIT_EXCEEDED", "metadata": { "quota_limit": "generate_content_free_tier_requests", "quota_limit_value": "0", "quota_metric": "generativelanguage.googleapis.com/generate_content_free_tier_requests" } }] } }

Ключевая деталь — имя метрики, содержащее free_tier_requests: оно показывает, что бэкенд Google отнёс ваш проект к бакету квот бесплатного уровня, независимо от вашего фактического статуса биллинга. Если бы вы были на платном уровне, метрика ссылалась бы на совершенно другой бакет квот (обычно generate_content_requests без префикса free_tier). Это различие тонкое, но критически важное для точной диагностики.

Ошибка обычно проявляется по одному из двух шаблонов. При первом шаблоне каждый вызов API завершается этой ошибкой, включая генерацию текста, что свидетельствует о проблеме с привязкой биллинга. При втором шаблоне текстовые модели работают нормально с лимитами платного уровня, но модели генерации изображений, такие как gemini-2.5-flash-image и gemini-3-pro-image-preview, возвращают ошибку free_tier_requests. Этот второй шаблон — характерный признак бага платформы Google от февраля 2026 года, о котором широко сообщается на форуме Google AI Developers. Определить, какой шаблон у вас, — это первый и самый важный шаг к решению проблемы, поскольку исправления для каждого сценария принципиально различаются, и применение неправильного решения лишь тратит ценное время на отладку.

Быстрая диагностика — проблема с биллингом или баг Google?

Диагностическая блок-схема, показывающая, как определить, вызвана ли ошибка free_tier_requests неправильной настройкой биллинга или багом платформы Google

Прежде чем исправлять проблему, нужно определить, с каким из двух сценариев вы имеете дело. Процесс диагностики занимает около шестидесяти секунд и включает три проверки, которые последовательно сужают круг возможных причин. Правильная диагностика важна, потому что исправления для каждого сценария совершенно разные — применение неправильного решения тратит время и может запутать ещё больше.

Проверка 1: Убедитесь, что Cloud Billing привязан. Перейдите на console.cloud.google.com/billing и проверьте, привязан ли платёжный аккаунт к проекту, в котором находится ваш API-ключ. Это не то же самое, что подписка Google One или Gemini Pro — для API-биллинга требуется аккаунт Cloud Billing, специально привязанный к вашему проекту GCP. Если платёжный аккаунт не привязан, вы нашли проблему и можете перейти к исправлению №1 в следующем разделе. Удивительно много разработчиков считают, что находятся на платном уровне, потому что зарегистрировались в Google AI Studio, но бесплатный доступ AI Studio не активирует автоматически платные квоты API.

Проверка 2: Протестируйте разные типы моделей. Если биллинг привязан, проведите простой тест. Отправьте базовый запрос на генерацию текста к текстовой модели, например gemini-2.5-flash, и отдельно — запрос к модели генерации изображений, например gemini-2.5-flash-image. Если текстовые модели работают нормально, а модели изображений выдают ошибку free_tier_requests, вы почти наверняка столкнулись с багом Google от февраля 2026 года. Этот баг специфически затрагивает эндпоинты генерации изображений, оставляя текстовые эндпоинты нетронутыми на том же аккаунте, создавая раздражающее разделённое поведение, которое сбивает разработчиков с толку.

Проверка 3: Время создания API-ключа. Если все модели не работают (и текстовые, и изображения), проверьте, когда ваш API-ключ был создан относительно момента включения биллинга. API-ключи, созданные через Google AI Studio до активации Cloud Billing на проекте, могут не унаследовать автоматически квоту платного уровня. Решение простое: создайте новый API-ключ после включения биллинга. Это менее распространённый сценарий, составляющий примерно 15% случаев, но он ставит в тупик разработчиков, которые создали ключи на этапе изучения бесплатного уровня и добавили биллинг позже.

По результатам этих трёх проверок вы попадёте в одну из трёх категорий: биллинг не привязан (исправление в следующем разделе), баг Google на моделях изображений (см. раздел с обходными путями) или проблема с временем создания ключа (создайте новый ключ). У каждой категории есть свой путь решения, и далее это руководство подробно описывает каждый из них.

Для быстрой проверки работоспособности вы также можете использовать следующую команду curl, чтобы протестировать API-ключ и увидеть сырой ответ, включая метаданные квот. Замените YOUR_API_KEY на ваш реальный ключ, а MODEL_NAME — на модель, которую хотите протестировать:

bash
curl -s "https://generativelanguage.googleapis.com/v1beta/models/MODEL_NAME:generateContent?key=YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"contents":[{"parts":[{"text":"Hello"}]}]}' | python3 -m json.tool

Если ответ содержит информацию о квотах в деталях ошибки, вы увидите, к какому именно бакету квот был отнесён ваш запрос. Успешный ответ платного уровня вернёт сгенерированный контент без метаданных об ошибках квот, подтверждая, что ваш проект корректно распознаётся как платный аккаунт.

Исправление №1 — правильная привязка Cloud Billing

Пошаговый процесс исправления биллинга, показывающий 6 шагов для привязки Cloud Billing и активации квот Tier 1

Это исправление устраняет самую распространённую причину ошибки free_tier_requests: Cloud Billing не привязан к вашему проекту Google Cloud. Даже если вы уверены, что биллинг настроен правильно, стоит пройти эти шаги для проверки, потому что в Google Cloud Console есть несколько страниц, связанных с биллингом, которые могут создать путаницу относительно вашего фактического статуса.

Шаг 1: Откройте Google Cloud Console. Перейдите на console.cloud.google.com и убедитесь, что вы вошли в тот же аккаунт Google, который используете для AI Studio. Это кажется очевидным, но разработчики, использующие несколько аккаунтов Google, иногда настраивают биллинг на неправильном аккаунте. Проверьте аватар аккаунта в правом верхнем углу, чтобы убедиться, что вы используете нужный аккаунт.

Шаг 2: Перейдите в раздел «Биллинг». Нажмите на значок меню (три горизонтальные линии) в верхнем левом углу, затем найдите и нажмите «Billing» на панели навигации. Если вы видите предложение «Link a billing account» или «Set up billing», значит вы подтвердили, что биллинг никогда не был правильно привязан — это и есть ваша основная причина. Если вы видите существующий платёжный аккаунт, переходите к проверке привязки к нужному проекту.

Шаг 3: Проверьте привязку проекта. В разделе вашего платёжного аккаунта нажмите «Account management» и найдите секцию «Projects linked to this billing account». Найдите проект, в котором находятся ваши API-ключи. Если вашего проекта нет в списке, нажмите «Link a project» и выберите его. Это критический шаг, который многие разработчики упускают: наличие платёжного аккаунта недостаточно — он должен быть явно привязан к проекту, где находятся ваши ключи Gemini API.

Шаг 4: Выполните предварительный платёж. Google может потребовать разовый предварительный платёж для активации платного доступа к API. Это не комиссия, а кредит, который применяется к вашему будущему использованию. Если появится такое требование, выполните этот шаг. Некоторые разработчики сообщают о суммах от $5 до $50 в зависимости от региона и истории аккаунта. Этот платёж зачисляется на баланс вашего аккаунта и расходуется по мере использования API (ai.google.dev/billing, февраль 2026).

Шаг 5: Создайте новый API-ключ (рекомендуется). После привязки биллинга перейдите на aistudio.google.com и создайте новый API-ключ в рамках проекта с активированным биллингом. Хотя существующие ключи должны унаследовать платную квоту, создание нового ключа исключает любые задержки кэширования или распространения. Используйте этот новый ключ в своём приложении и сразу протестируйте.

Шаг 6: Проверьте повышение уровня. Выполните тестовый вызов API и проверьте заголовки ответа. Успешный ответ платного уровня не должен содержать метрик квот free_tier_requests. Альтернативно, проверьте страницу квот по адресу console.cloud.google.com/apis/api/generativelanguage.googleapis.com/quotas, чтобы увидеть обновлённые лимиты. Вы должны увидеть значения RPM 150-300 вместо 5-15 RPM бесплатного уровня. Повышение до Tier 1 происходит мгновенно после правильной привязки биллинга — периода ожидания для первого уровня не существует.

Если после выполнения всех шести шагов текстовые модели работают с платными лимитами, но модели генерации изображений по-прежнему показывают ошибку free_tier_requests, скорее всего, вы столкнулись с багом платформы Google, описанным в следующем разделе. Не продолжайте перепривязывать биллинг или создавать новые ключи — это не поможет, если основная проблема на стороне Google.

Дополнительный шаг верификации, помогающий подтвердить успешное исправление: посетите панель квот API по адресу console.cloud.google.com/apis/api/generativelanguage.googleapis.com/quotas и найдите метрику «GenerateContent requests per minute per project per base_model». На бесплатном уровне это значение показывает однозначные числа вроде 5 или 10. На Tier 1 оно должно отображать значения в диапазоне 150-300. Если вы видите числа Tier 1, привязка биллинга подтверждена, и любые оставшиеся ошибки free_tier_requests на конкретных моделях объясняются багом платформы Google, а не конфигурацией вашего аккаунта.

Исправление №2 — когда это баг платформы Google

Примерно с 10 февраля 2026 года растущее число разработчиков сообщает, что их платные аккаунты Tier 1 получают ошибку free_tier_requests limit: 0 именно на моделях генерации изображений, тогда как текстовые модели на том же аккаунте работают безупречно с квотами платного уровня. Это подтверждено в нескольких обсуждениях на форуме Google AI Developers, в сообщениях разработчиков, которые проверили корректность настройки биллинга и перепробовали все стандартные способы устранения неполадок безуспешно.

Баг, по всей видимости, затрагивает конкретные эндпоинты моделей генерации изображений, включая gemini-2.5-flash-image и gemini-3-pro-image-preview (модель, внутренне известная как «Nano Banana Pro»). Пользователи сообщают, что запросы к этим моделям возвращают знакомую ошибку 429 с метрикой free_tier_requests, хотя идентичные запросы к текстовым моделям, таким как gemini-2.5-pro или gemini-2.5-flash, выполняются без каких-либо проблем с квотами. Такая избирательная схема сбоев — наиболее убедительный индикатор того, что проблема на уровне платформы, а не в конфигурации пользователя. Если вы уже изучили лимиты бесплатного уровня Gemini 3 Pro для генерации изображений и подтвердили, что у вас должен быть платный доступ, то этот баг, вероятнее всего, и является вашим блокером.

В ожидании решения со стороны Google существует несколько практических обходных путей, позволяющих продолжать работу над проектами. Первый и самый простой подход — использовать текстовые модели для любых задач, которые не требуют строго графического вывода. Модели Gemini 2.5 Pro и Flash обладают мощными мультимодальными возможностями для анализа и понимания изображений, и эти текстовые эндпоинты не затронуты багом. Если вашему приложению конкретно нужна генерация изображений, рассмотрите временное использование другого API генерации изображений, например DALL-E 3 от OpenAI или эндпоинтов Stability AI, которые могут служить заменой для части рабочего процесса, связанной с генерацией изображений.

Ещё один обходной путь, с которым некоторые разработчики добились успеха, — использование эндпоинта Vertex AI вместо эндпоинта AI Studio. Vertex AI использует другую систему управления квотами, и некоторые пользователи сообщают, что генерация изображений работает корректно через Vertex AI, даже когда эндпоинт AI Studio заблокирован. Компромисс в том, что Vertex AI требует дополнительной настройки, включая аутентификацию через сервисный аккаунт и немного другой формат API, но это может быть жизнеспособным промежуточным решением для продакшен-приложений, которые не могут ждать исправления бага.

Для разработчиков, которым нужно быстрое и надёжное решение без сложности миграции на Vertex AI, сторонние прокси-сервисы API обеспечивают немедленный доступ к возможностям генерации изображений Gemini. Такие сервисы, как laozhang.ai, агрегируют доступ к API и маршрутизируют запросы через правильно настроенные аккаунты, обходя проблемы квот отдельных проектов. Это может быть особенно полезно в качестве временного моста, пока Google устраняет основной баг платформы.

Независимо от того, какой обходной путь вы выберете, настоятельно рекомендуется сообщить о своём опыте на форуме Google AI Developers и проголосовать за существующие темы с отчётами о баге. Видимость таких отчётов напрямую влияет на приоритизацию исправления со стороны Google. Включите в отчёт ID вашего проекта (не API-ключ), конкретные затронутые модели и точный текст ответа об ошибке, чтобы помочь инженерной команде Google быстрее диагностировать и устранить проблему. Подробную информацию о том, как устроены лимиты Nano Banana Pro, можно найти в нашем отдельном руководстве.

Также стоит следить за официальным трекером проблем Google и форумом AI Developers на предмет обновлений. Предыдущие баги, связанные с биллингом в Gemini API, обычно исправлялись в течение одной-трёх недель после массовых сообщений, хотя Google редко заранее предупреждает о сроках выпуска исправлений. Настройка Google Alert по запросу «gemini api free_tier_requests bug» поможет вам поймать объявление об исправлении, когда оно появится, чтобы сразу переключиться с обходного пути на прямой эндпоинт Gemini API.

Как устроена система уровней и квот Gemini API

Сравнение уровней Gemini API: лимиты Free, Tier 1 и Tier 2, требования для повышения

Понимание того, как Google структурирует свою систему уровней API, помогает как предотвращать проблемы с квотами, так и принимать обоснованные решения об использовании. Gemini API использует многоуровневую систему, в которой более высокие уровни открывают прогрессивно большие лимиты запросов, а путь повышения между уровнями основан на совокупных расходах и возрасте аккаунта, а не на модели подписки.

Бесплатный уровень — это стартовая точка для каждого нового пользователя Gemini API, предоставляющая ограниченный, но функциональный доступ для экспериментов и небольших проектов. По состоянию на февраль 2026 года бесплатный уровень позволяет 5 RPM для Gemini 2.5 Pro, 10 RPM для Gemini 2.5 Flash и 15 RPM для Gemini 2.5 Flash-Lite (ai.google.dev/gemini-api/docs/rate-limits, февраль 2026). Также действуют дневные лимиты запросов: 100 запросов в день для Pro и 250 для Flash. Критически важно, что бесплатный уровень предоставляет ноль изображений в минуту (0 IPM) для генерации изображений — это означает, что генерация изображений на бесплатном уровне полностью недоступна, а не просто ограничена. Стоит отметить, что Google значительно сократил лимиты бесплатного уровня в декабре 2025 года, уменьшив квоты на 50-80% по сравнению с предыдущими значениями, что застало многих разработчиков врасплох. Полный анализ этих изменений можно найти в нашем руководстве по бесплатному уровню Gemini API.

Tier 1 активируется мгновенно при включении Cloud Billing на проекте — без периода ожидания и без минимальных требований к расходам. Это один из самых важных фактов, которые многие разработчики упускают: вам не нужно платить что-либо заранее для получения доступа Tier 1, хотя Google может потребовать разовый предварительный платёж, который служит кредитом на использование. Tier 1 обеспечивает драматический рост лимитов: 150-300 RPM для большинства моделей (улучшение в 30-60 раз по сравнению с бесплатным уровнем), неограниченные дневные запросы и доступ к эндпоинтам генерации изображений. Это уровень, на который должны ориентироваться большинство индивидуальных разработчиков и небольших команд. Руководство по лимитам Gemini API рассматривает эти цифры более подробно.

Tier 2 и выше предназначены для продакшен-нагрузок и приложений с высоким объёмом запросов. Для достижения Tier 2 требуется $250 или более совокупных расходов на API и минимум 30 дней на Tier 1. Повышение происходит автоматически в течение примерно 10 минут после выполнения требований, увеличивая RPM до 1000 и выше для большинства моделей. Tier 3 следует аналогичной схеме: $1000+ совокупных расходов и 30+ дней на предыдущем уровне.

Критически важная архитектурная деталь: квоты применяются на уровне проекта, а не на уровне API-ключа (ai.google.dev, февраль 2026). Это означает, что создание нескольких API-ключей в одном проекте не умножает вашу квоту — все ключи разделяют один пул. Если вам нужны отдельные пулы квот для разных приложений, необходимо создавать отдельные проекты Google Cloud, каждый со своей привязкой к биллингу. Дневные квоты сбрасываются в полночь по тихоокеанскому времени, поэтому если вы достигаете дневных лимитов, планирование запросов с учётом этого сброса может быть практичным обходным решением.

Следующая таблица суммирует ключевые различия между уровнями, наиболее важные для разработчиков, столкнувшихся с ошибкой free_tier_requests:

МетрикаБесплатный уровеньTier 1Tier 2+
RPM (модели Pro)51501 000+
RPM (модели Flash)10-153002 000+
Дневной лимит запросов100-250Без ограниченийБез ограничений
Генерация изображений0 IPMДоступнаДоступна
Требование для повышенияПривязка Cloud Billing$250 расходов + 30 дней
Скорость повышенияМгновенно~10 минут

Источник: ai.google.dev/gemini-api/docs/rate-limits, февраль 2026

Понимание этой таблицы объясняет, почему ошибка «free_tier_requests limit: 0» настолько разрушительна. На бесплатном уровне ваше выделение для генерации изображений буквально равно нулю — не ограничено, а полностью заблокировано. Это предусмотрено для бесплатных аккаунтов, но когда система биллинга ошибочно относит ваш платный проект к бакету бесплатного уровня, это фактически лишает доступа к генерации изображений и серьёзно ограничивает доступ к текстовым моделям.

Альтернативные решения при заблокированной квоте

Когда ваша квота Gemini API застряла на нуле и стандартные исправления не помогли, нужны практические альтернативы для продолжения работы над проектами. Цель здесь — не заменить Gemini навсегда, а иметь надёжные запасные варианты, минимизирующие простой, пока вы ждёте решения проблемы с квотами. Каждая альтернатива имеет свои сильные стороны с точки зрения стоимости, возможностей и сложности интеграции.

Самая простая альтернатива для генерации изображений — использовать другого провайдера моделей через его нативный API. DALL-E 3 от OpenAI обеспечивает высококачественную генерацию изображений с хорошо документированным API, а эндпоинты SDXL от Stability AI предлагают конкурентное качество при более низкой стоимости за изображение. Оба сервиса имеют собственные системы биллинга, независимые от Google, поэтому они не подвержены проблемам с квотами Gemini. Компромисс в том, что вам придётся адаптировать промпт-инжиниринг и код интеграции API под формат другого провайдера, хотя изменения обычно минимальны для базовых задач генерации изображений.

Для разработчиков, которые хотят сохранить совместимость с форматом Gemini API, избегая при этом проблем с квотами на уровне проекта, сторонние сервисы агрегации API предоставляют интересный промежуточный вариант. Платформы вроде laozhang.ai предлагают унифицированные эндпоинты API, совместимые с форматом OpenAI API, и обеспечивают доступ к моделям Gemini через правильно настроенную инфраструктуру. Эти сервисы берут на себя управление биллингом и квотами, что означает надёжный доступ без беспокойства о системе уровней Google или текущем баге платформы. Стоимость за запрос через агрегаторы обычно конкурентоспособна или даже ниже официальных цен, особенно для моделей генерации изображений, где laozhang.ai берёт примерно $0,05 за изображение по сравнению с официальным тарифом.

Если ваше приложение в значительной степени зависит от специфических возможностей Gemini и вы хотите остаться в экосистеме Google, миграция на эндпоинт Vertex AI стоит рассмотрения как более постоянное решение. Vertex AI использует управление квотами корпоративного уровня, которое отделено от системы квот AI Studio, и предоставляет дополнительные функции: файн-тюнинг, мониторинг моделей и корпоративные средства безопасности. Настройка более сложная — вам потребуется настроить сервисные аккаунты, включить Vertex AI API и изменить формат запросов — но улучшение надёжности может оправдать усилия для продакшен-приложений.

Профилактика — как правильно настроить биллинг с самого начала

Профилактика гораздо эффективнее устранения неполадок, и правильная настройка биллинга Gemini API с самого начала полностью исключает самую распространённую причину ошибки free_tier_requests. Следующие лучшие практики основаны на паттернах, наблюдаемых в сотнях сообщений на форумах, и официальной документации Google.

Настройте биллинг до создания API-ключей. Единственная наиболее эффективная мера профилактики — включить Cloud Billing на проекте Google Cloud до создания каких-либо API-ключей. Это гарантирует, что каждый ключ, сгенерированный в рамках этого проекта, автоматически ассоциируется с квотами платного уровня с момента создания. Разработчики, которые создают ключи на бесплатном уровне и потом добавляют биллинг, иногда сталкиваются с проблемой тайминга, при которой старые ключи не наследуют платную квоту. Хотя согласно документации Google этого происходить не должно, сообщения на форумах свидетельствуют о том, что это случается время от времени, и создание ключей после активации биллинга полностью исключает эту проблему.

Используйте выделенный проект GCP для доступа к API. Создайте отдельный проект Google Cloud специально для использования Gemini API, а не используйте проект по умолчанию или общий проект. Это обеспечивает чистую изоляцию квот, упрощает отслеживание расходов и облегчает устранение неполадок в случае проблем с квотами. Дайте проекту описательное имя (например, «gemini-api-production»), чтобы легко находить его в Cloud Console. Поскольку квоты применяются на уровне проекта, вы также можете создать несколько проектов, если нужны независимые пулы квот для разных приложений.

Проверяйте уровень после активации биллинга. После привязки биллинга не просто предполагайте, что повышение произошло. Выполните тестовый вызов API и проверьте ответ на наличие метрик free_tier_requests. Ещё лучше — проверьте страницу квот API в Cloud Console, чтобы убедиться, что лимиты повышены до значений Tier 1 (150-300 RPM). Если повышение не распространилось в течение пяти минут, попробуйте создать новый API-ключ — иногда это запускает обновление квоты.

Проактивно отслеживайте использование квот. Настройте мониторинг квот в Google Cloud Console, чтобы получать оповещения до достижения лимитов, а не после. Перейдите в APIs & Services, затем Quotas и настройте пороги оповещений на 80% и 95% лимитов квот. Это даёт раннее предупреждение о приближении к лимитам и помогает отличить легитимное высокое использование от неожиданных ограничений квот. Проактивный мониторинг также предоставляет доказательства, если вам нужно сообщить о баге квот в Google — вы сможете показать, что ваш паттерн использования не соответствует применяемым лимитам бесплатного уровня.

Ведите документацию по биллингу и API-ключам. Ведите простой журнал: какой платёжный аккаунт привязан к какому проекту, когда был включен биллинг и когда создан каждый API-ключ. Эта документация бесценна при устранении неполадок с квотами и ускоряет любое взаимодействие со службой поддержки Google. Включите ID проекта (находится в настройках Cloud Console) и даты создания ключей в свои записи.

Реализуйте логику повторных попыток с экспоненциальной задержкой. Даже на платных уровнях временные ошибки 429 могут возникать в периоды пиковой нагрузки или кратковременных сбоев сервиса. Встраивание логики повторных попыток в код API-клиента с самого начала гарантирует, что ваше приложение обрабатывает такие ситуации корректно без ручного вмешательства. Стандартная стратегия экспоненциальной задержки — начинать с одной секунды, удваивая при каждой попытке до максимума в 32 секунды, с добавлением случайного джиттера — покрывает как квотные, так и серверные ответы 429. Большинство популярных клиентских библиотек API включают встроенную поддержку повторных попыток; например, Python-библиотека google-generativeai автоматически обрабатывает повторы при соответствующей настройке.

Настройте оповещения о расходах для раннего обнаружения проблем. Настройте бюджетные оповещения в Google Cloud Console в разделе Billing > Budgets & alerts. Установите пороги оповещений на 50%, 80% и 100% ожидаемых ежемесячных расходов. Эти оповещения выполняют двойную функцию: они уведомляют вас, если использование резко возрастёт (что может указывать на компрометацию ключа или вышедший из-под контроля процесс), и подтверждают, что биллинг активно отслеживает использование — если вы на платном уровне, но никогда не получаете оповещений, это может указывать на проблему с привязкой биллинга. Кроме того, если ваши расходы неожиданно упадут до нуля при работающем приложении, это может сигнализировать о том, что ваш проект был возвращён на бесплатный уровень.

FAQ

Решает ли создание нового API-ключа после включения биллинга проблему с квотами?

Во многих случаях — да. Если ваш исходный API-ключ был создан до привязки Cloud Billing к проекту, создание нового ключа после активации биллинга часто решает ошибку free_tier_requests. Новый ключ генерируется в контексте проекта с активным биллингом и должен автоматически получить лимиты квот Tier 1. Однако если вы столкнулись с багом Google от февраля 2026 года конкретно на моделях генерации изображений, новый ключ не поможет, поскольку проблема находится на уровне платформы, а не на уровне ключа.

Почему текстовые модели работают, а модели изображений возвращают ошибку free_tier_requests?

Это характерный симптом бага платформы Google от февраля 2026 года. Баг, по всей видимости, затрагивает назначение квот именно для эндпоинтов моделей генерации изображений (таких как gemini-2.5-flash-image и gemini-3-pro-image-preview), оставляя квоты текстовых моделей правильно настроенными. Google признал эту проблему на своём форуме для разработчиков, но пока не предоставил сроков исправления. В это время используйте обходные пути, описанные в данном руководстве, включая миграцию на Vertex AI и сторонние прокси-сервисы API.

Сколько времени занимает распространение обновления до Tier 1?

Повышение с бесплатного уровня до Tier 1 должно произойти мгновенно после правильной привязки Cloud Billing к проекту (ai.google.dev, февраль 2026). Если обновление не отразилось в течение пяти минут, попробуйте создать новый API-ключ в проекте с активным биллингом. Для повышения с Tier 1 до Tier 2, которое требует $250 или более совокупных расходов и минимум 30 дней на Tier 1, распространение обычно занимает около 10 минут после выполнения требований.

Разделяют ли несколько API-ключей одну квоту?

Да. Квоты в Gemini API применяются на уровне проекта, а не ключа (ai.google.dev, февраль 2026). Все API-ключи, созданные в рамках одного проекта Google Cloud, разделяют один и тот же пул квот. Создание дополнительных ключей не увеличивает доступную квоту. Если вам нужны отдельные пулы квот, необходимо создавать отдельные проекты Google Cloud, каждый со своей привязкой к платёжному аккаунту. Это частый источник путаницы среди разработчиков, которые предполагают, что генерация нового API-ключа даст им новую квоту. Это не так — ключ является просто учётной записью, тогда как квота привязана к ресурсу проекта.

Может ли ошибка 429 означать перегрузку сервера, а не исчерпание квоты пользователя?

Да, код ответа 429 иногда может указывать на то, что серверы Google находятся под высокой нагрузкой, независимо от вашей индивидуальной квоты. В этом случае ошибка является временной, и повторная попытка после небольшой задержки (с использованием экспоненциальной задержки) часто завершается успешно. Отличить исчерпание квоты от перегрузки сервера можно, изучив детали ошибки: при исчерпании квоты будет присутствовать поле quotaMetric с конкретной информацией о квоте, тогда как перегрузка сервера обычно использует другую структуру ошибки. Если вы наблюдаете прерывистые ошибки 429, которые проходят в течение секунд, перегрузка сервера — более вероятная причина. Реализация экспоненциальной задержки с джиттером в коде API-клиента считается лучшей практикой независимо от типа ошибки, поскольку она корректно обрабатывает оба сценария без необходимости ручного вмешательства.

Поделиться:

laozhang.ai

Один API, все модели ИИ

AI Изображения

Gemini 3 Pro Image

$0.05/изобр.
-80%
AI Видео

Sora 2 · Veo 3.1

$0.15/видео
Async API
AI Чат

GPT · Claude · Gemini

200+ моделей
Офиц. цена
Обслужено 100K+ разработчиков
|@laozhang_cn|$0.1 бонус