Gemini API 免费层速率限制 2026：20 RPD 是不是实时限制、去哪看真实配额、为什么多个 Key 共用一个限制

AI Free API Team

•2026年2月2日•最后更新 2026年5月3日•12 分钟阅读•API 指南

Gemini API 免费层在 2026 年仍然存在，但 20 RPD 不能直接当成所有项目的固定公开限制，也不会因为新建多个 API key 而叠加。先用 pricing 页面确认模型是否免费，再用 AI Studio 查看当前 project 的实时 RPM、TPM、RPD 和 billing 状态。

Gemini API 免费层速率限制 2026：20 RPD 是不是实时限制、去哪看真实配额、为什么多个 Key 共用一个限制

Gemini API 免费层在 2026 年仍然存在，但你的 quota 面板、报错上下文或近期讨论里出现 “20 RPD” 时，不能直接把它当成上线限制。它说明当前 project 可能处在很小的免费额度桶里，而不是 Google 给所有项目承诺的一张固定公开表。Google 的 pricing 页面告诉你目标模型和调用方式是否还属于 Free Tier；AI Studio 才告诉你当前这个 project、模型、区域和 billing 状态下真正能用的 active limits。先看这两个入口，再决定是否换模型、压低并发、转付费、准备 prepay 余额，或者申请更高 quota。新建更多 API key 通常不是答案，因为同一个 Google Cloud project 里的 key 共用同一个配额池。

先说结论

问题	2026 年 5 月 3 日的可发布答案
Gemini API 还有免费层吗？	有。Google pricing 页面仍然给若干 Gemini Developer API 路线标出 Free Tier。
20 RPD 免费层限制是真的吗？	它可能对某个 project、model 或账号状态真实存在，但不是可以写进代码的通用额度。真正可用的 RPD 要在 AI Studio 里按 project、model、tier 和 billing state 查看。
有没有一个可以写进代码的公开固定限额？	没有。公开文档解释 RPM、TPM、RPD 和 project 级规则，实际 active limits 要看 AI Studio。
多个 API key 会增加免费额度吗？	不会。同一 project 下多个 key 共享同一个 quota bucket。
哪些路线现在可以先按免费资格评估？	先查 pricing。当前可见的免费输入/输出路线包括 `gemini-3-flash-preview`、`gemini-3.1-flash-lite-preview`、`gemini-3.1-flash-live-preview`、`gemini-2.5-pro`、`gemini-2.5-flash` 和 `gemini-2.5-flash-lite` 的合格 serving mode。
哪些路线不应该叫免费 API？	`gemini-3.1-pro-preview`、Gemini 3 Pro Image Preview、Gemini 3.1 Flash Image Preview、Imagen、Veo，以及很多 Batch/Flex/Image 路线在 Free Tier 栏里是 Not available。
遇到 429 先做什么？	先确认调用面、project、model、serving mode 和 AI Studio quota，再判断是 RPM、TPM、RPD、突发并发、billing、模型资格还是 provider route 的限制。

事实复核：本文在 2026 年 5 月 3 日核对了 Google rate limits、pricing、billing、API key 和 terms 文档，并重新确认了 20 RPD 的边界。价格、模型资格和限额都是易变事实，上线前要重新查看官方页面和 AI Studio。

最大变化不在数字，在答案入口

很多旧文章会直接给一张 “Gemini API 免费额度表”。只问 “20 RPD” 本质上也是想把当前额度压成一个固定数字。这种表最多只能当历史快照，不能当 2026 年的上线合同。现在要把两个问题拆开：

目标模型和 serving mode 有没有 Free Tier 资格。
你的 project 今天在 AI Studio 里实际显示多少 RPM、TPM、RPD 或其他模型维度。

Gemini API rate-limits 文档仍然解释了最重要的机制：限制会按 requests per minute、tokens per minute、requests per day 等维度生效；只要其中一个维度超限，就可能触发错误；RPD 按太平洋时间午夜重置；quota 按 project 而不是按 API key 生效。它的价值是规则说明，不是替你承诺每个账号的最终容量。

真正可执行的做法是把 Gemini pricing 页面当作模型资格入口，把 AI Studio rate-limit view 当作实时 project quota 入口。只要旧表或被反复引用的数字和这两个入口冲突，旧表就不能作为决策依据。

Gemini API 免费层限制的事实来源图：pricing 负责模型资格，AI Studio 负责实时 project quota

现在 Gemini API 里到底哪些模型还免费？

模型资格是第一道门。如果目标模型本来就没有 Free Tier，后面讨论每分钟多少次请求没有意义。

Gemini API 模型资格与免费层、付费层、billing 和 route 选择的决策图

路线	免费层状态怎么读	实际含义
`gemini-3.1-flash-lite-preview`	pricing 当前在多个 serving mode 里列出 free input/output。	适合成本敏感的文本、多模态和高频原型，但 preview 限额会更紧、更易变。
`gemini-3.1-flash-live-preview`	Live API 路线当前列出免费输入/输出。	这是实时音频/Live API 合同，不等同于普通文本请求。
`gemini-3-flash-preview`	Standard/Priority 当前有 Free Tier，Batch/Flex 不能直接按免费理解。	适合一般 3 系能力原型，但 serving mode 会改变资格。
`gemini-2.5-pro`	Standard/Priority 当前有 Free Tier。	当 3.1 Pro API paid-only 时，它仍是强推理的免费 fallback。
`gemini-2.5-flash` / `gemini-2.5-flash-lite`	当前仍有免费输入/输出路线。	适合低风险原型、教学、成本测试和小流量工具。
`gemini-3.1-pro-preview`	Free Tier 显示 Not available。	AI Studio 试用不等于后端 API 免费调用。需要这条路线时，先读 Gemini 3.1 Pro free API 边界。
图像、Imagen、Veo 等路线	多数 API 图像/视频路线当前不是 Free Tier。	不要把 AI Studio 体验、促销演示和 API 免费后端混成一个结论。

这张表故意不是 quota 表。它只回答“有没有资格开始免费评估”。一个模型可以免费合格，但你的 project active limit 仍然很低；一个模型可以出现在 AI Studio 里，但 API 后端仍是 paid-only；一个 preview 模型今天能用，也可能在下一次发布或限额调整后变得更严格。

为什么新 API key 不会增加配额

API key 是访问凭证，quota bucket 属于 project。这个边界必须写在免费层文章前半部分，因为很多人看到 429 后第一反应是“再创建几个 key”。如果这些 key 仍然挂在同一个 Google Cloud project 下，它们只是同一个限额池的多个入口。

只有在真实所有权不同的时候，才应该拆 project：例如 staging 和 production 由不同 billing owner 管理；团队权限、审计和安全边界不同；地区、合规或客户隔离要求不同；或者你确实需要分别监控用量和成本。为了绕过免费层 cap 而拆 project，既不稳定，也容易把诊断做乱。

所以遇到速率限制时，正确问题不是“还能开几个 key”，而是：

这个 key 是否属于我以为的 project？
这个 project 是否绑定了正确 billing account？
目标 model 和 serving mode 是否仍然 free-capable？
当前 RPM、TPM、RPD 哪个维度先被打满？
这个 workload 是否应该改成 queue、cache、token cap、paid tier 或官方 quota increase？

如果答案已经指向容量问题，就不要用 key rotation 假装修复。

Billing 和预付费可能才是隐藏限制

付费层也不能再简单理解成“绑卡就结束”。Google 的 billing 文档把 Prepay 和 Postpay 计划拆开，并说明新的 billing plan 系统从 2026 年 3 月 23 日开始生效。

真正需要检查的是：project 是否已经绑定 billing account；AI Studio 是否要求 set up billing 或 set up prepay；billing account 是否还有余额；账户是在 Prepay 还是 Postpay；是否设置 auto-reload；当前 tier 是否支持你期待的容量。Prepay 尤其关键，因为余额归零可能让挂在同一个 billing account 下的 Gemini API 服务一起停掉。

如果你只是想看从 key 创建到 tier 检查的界面路径，可以接着读 Gemini API key 与 Tier 3 指南。对免费层速率限制来说，billing 的角色很清楚：它是容量、数据条款和可持续服务的边界，不是免费层速率限制的魔法开关。

上线前如何确认实时限额

把这套检查当成每次正式原型、demo 或上线前的短流程：

打开 pricing 页面，确认目标模型和 serving mode 仍有 Free Tier。
打开 AI Studio，切到真正准备调用的 project。
在 rate-limit view 里记录 RPM、TPM、RPD，以及模型可能额外出现的维度。
确认 project 的 billing 状态、prepay 或 postpay 状态、余额和 billing account tier。
记录 model、project、region、billing state、timestamp 和看到的 limit。
一旦切换模型、project、region、billing account、serving mode 或流量形态，就重新检查。

这一步看起来很机械，却能避免大多数错误架构。如果 AI Studio 显示 RPD 不足以支撑 demo day，修复不是复制旧表，也不是新建 key，而是排队、换模型、降低输出、转 paid tier 或准备 quota increase。

429 在免费层里真正意味着什么

429 不是“免费层没了”的证据，也不是“立刻付费”这一种答案。它说明某个 owner 先拦住了请求。

Gemini API 免费层 429 恢复阶梯：确认调用面、查 active quota、降低压力并带证据升级

步骤	要确认什么	为什么重要
调用面	官方 Gemini API、AI Studio UI，还是第三方 provider。	provider 429 不一定是 Google project quota。
project 与 key	key 所属 project、key restriction、billing account 是否一致。	混用 project 会让观察到的 limit 看起来互相矛盾。
model 与 serving mode	model ID、Standard/Batch/Flex/Priority、preview 状态、region。	免费资格和限额按模型与模式变化。
AI Studio quota	RPM、TPM、RPD、reset window、usage 和额外维度。	这里决定是哪一个 owner 触发。
降低压力	降并发、排队、缓存、缩短 prompt、限制 max output、加入 jittered backoff。	真正的 rate-limit 修复通常先改变流量形态。
带证据升级	记录 project、model、时间、当前 limit、用量曲线和已尝试修复。	申请提高限额或找支持时，需要事实包。

如果你已经确认错误属于更一般的 API 限流，而不是免费资格，可以继续看 Gemini API rate limits guide 和 Gemini API 错误排查指南。

什么时候免费层够用，什么时候不够

免费层适合评估，不适合承诺基础设施。它很适合 prompt exploration、课程示例、低风险 PoC、内部 demo、个人工具、模型比较、早期成本测试和短期 agent 原型。即使是这些场景，也应该从第一天就写 queue、cache、token cap、429 logging 和 backoff。这样以后转付费或换 provider 时，不需要推翻架构。

免费层不适合的场景也很明确：需要 predictable capacity、付费模型、真实客户数据处理、生产支持预期，或者在 EEA、瑞士、英国面向用户提供 API client。Google 的 Gemini API terms 对 unpaid services 和 paid services 的数据使用边界不同；未付费使用可以被用于改进 Google 产品，并可能有人审处理输入输出。对客户数据或正式产品来说，这不是脚注，而是上线边界。

第三方 fallback 应该放在哪里

官方 Google 路线必须先查清楚。只有当你已经知道官方路线无法满足容量、地区、模型、billing、稳定性或兼容性要求时，fallback provider 或多模型网关才有意义。

如果团队需要一个跨 provider 的兼容网关，可以把 laozhang.ai 放在后置评估位：先确认官方 Gemini 模型是否 free-capable，再确认 AI Studio 中这个 project 的真实 quota，再减少可避免的 429，最后决定 paid tier、quota increase 或 provider fallback。不要把 provider 当作当前官方事实的替代品。模型覆盖、价格、延迟、服务范围都属于易变事实，真正切流前要在 provider dashboard 里验证。

上线检查清单

Gemini API 免费层上线检查清单：pricing、AI Studio quota、project key、terms、request shaping 和升级触发器

Pricing 页面确认目标 model 与 serving mode 仍然 free-capable。
AI Studio 对同一个 project 和 model 显示的 active quota 足够。
API key 属于预期 project，没有混用 staging、demo 或个人项目。
billing 状态、prepay 余额和 billing account owner 已经明确。
请求代码有 queue、jittered backoff、token cap 和 429 owner logging。
dashboard 能区分 RPM、TPM、RPD、billing failure 和 provider failure。
unpaid quota 中发送的数据符合 unpaid-service terms。
EEA、瑞士、英国用户面向场景走 paid services。
用户流量依赖容量前，已经有 paid-tier、quota-increase 或 fallback-route 决策。

FAQ

Gemini API key 还能免费创建吗？

可以。Google AI Studio 仍然能创建 Gemini API key。免费创建 key 不等于每个 key 都有独立免费容量，真正要看 project、model 和 AI Studio active limits。

每个 key 都有自己的免费速率限制吗？

没有。rate-limits 文档写明配额按 project 生效，不按 API key 生效。同一 project 下更多 key 不会创造更多 quota。

我的真实免费层限额在哪里看？

看 AI Studio 的 rate-limit view，并确保选中正确 project 和 model。公开文档解释维度；AI Studio 显示当前 project 的实际限制。

哪些 Gemini 模型现在还能免费 API 调用？

答案随模型和 serving mode 变化。2026 年 5 月 2 日，pricing 页面仍给多个路线列出免费输入/输出，包括 Gemini 3.1 Flash-Lite Preview、Gemini 3.1 Flash Live Preview、Gemini 3 Flash Preview、Gemini 2.5 Pro、Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite。上线前仍要复核。

Gemini 3.1 Pro API 免费吗？

不免费。pricing 页面把 gemini-3.1-pro-preview 的 Free Tier 标为 Not available。AI Studio 体验不要和后端 API 免费混为一谈。

429 是不是说明免费层被取消了？

通常不是。429 说明某个活跃限制被打满，可能是 RPM、TPM、RPD、突发并发、模型资格、billing、project scope 或 provider route。先查 AI Studio 和日志，再改架构。

免费层能不能用于生产？

适合原型和低风险评估。需要可预测容量、付费数据处理、paid-only 模型、正式用户流量或特定地区合规边界时，应转向 paid services 或更稳定的 route。

实际结论

Gemini API 免费层仍然真实存在，但它不是一张全网通用的静态 quota 表，也不会因为你多开几个 API key 而变多。正确顺序是：pricing 页面判断模型资格，AI Studio 判断当前 project 的 live quota，billing 页面判断容量和 prepay，terms 判断数据使用与地区上线边界。这个顺序比任何复制来的 RPM/RPD 数字更有用，因为它回答的是你的项目今天能不能安全运行，以及上线前到底该改哪一层。

先说结论

最大变化不在数字，在答案入口

1. 目标模型和 serving mode 有没有 Free Tier 资格。 2. 你的 project 今天在 AI Studio 里实际显示多少 RPM、TPM、RPD 或其他模型维度。

现在 Gemini API 里到底哪些模型还免费？

模型资格是第一道门。如果目标模型本来就没有 Free Tier，后面讨论每分钟多少次请求没有意义。

为什么新 API key 不会增加配额

所以遇到速率限制时，正确问题不是“还能开几个 key”，而是：

- 这个 key 是否属于我以为的 project？ - 这个 project 是否绑定了正确 billing account？ - 目标 model 和 serving mode 是否仍然 free-capable？ - 当前 RPM、TPM、RPD 哪个维度先被打满？ - 这个 workload 是否应该改成 queue、cache、token cap、paid tier 或官方 quota increase？

如果答案已经指向容量问题，就不要用 key rotation 假装修复。

Billing 和预付费可能才是隐藏限制

付费层也不能再简单理解成“绑卡就结束”。Google 的 billing 文档把 Prepay 和 Postpay 计划拆开，并说明新的 billing plan 系统从 2026 年 3 月 23 日开始生效。

上线前如何确认实时限额

把这套检查当成每次正式原型、demo 或上线前的短流程：

1. 打开 pricing 页面，确认目标模型和 serving mode 仍有 Free Tier。 2. 打开 AI Studio，切到真正准备调用的 project。 3. 在 rate-limit view 里记录 RPM、TPM、RPD，以及模型可能额外出现的维度。 4. 确认 project 的 billing 状态、prepay 或 postpay 状态、余额和 billing account tier。 5. 记录 model、project、region、billing state、timestamp 和看到的 limit。 6. 一旦切换模型、project、region、billing account、serving mode 或流量形态，就重新检查。

429 在免费层里真正意味着什么

429 不是“免费层没了”的证据，也不是“立刻付费”这一种答案。它说明某个 owner 先拦住了请求。

如果你已经确认错误属于更一般的 API 限流，而不是免费资格，可以继续看 Gemini API rate limits guide 和 Gemini API 错误排查指南。

什么时候免费层够用，什么时候不够

第三方 fallback 应该放在哪里

如果团队需要一个跨 provider 的兼容网关，可以把 laozhang.ai 放在后置评估位：先确认官方 Gemini 模型是否 free-capable，再确认 AI Studio 中这个 project 的真实 quota，再减少可避免的 429，最后决定 paid tier、quota increase 或 provider fallback。不要把 provider 当作当前官方事实的替代品。模型覆盖、价格、延迟、服务范围都属于易变事实，真正切流前要在 provider dashboard 里验证。

上线检查清单

- Pricing 页面确认目标 model 与 serving mode 仍然 free-capable。 - AI Studio 对同一个 project 和 model 显示的 active quota 足够。 - API key 属于预期 project，没有混用 staging、demo 或个人项目。 - billing 状态、prepay 余额和 billing account owner 已经明确。 - 请求代码有 queue、jittered backoff、token cap 和 429 owner logging。 - dashboard 能区分 RPM、TPM、RPD、billing failure 和 provider failure。 - unpaid quota 中发送的数据符合 unpaid-service terms。 - EEA、瑞士、英国用户面向场景走 paid services。 - 用户流量依赖容量前，已经有 paid-tier、quota-increase 或 fallback-route 决策。

FAQ

Gemini API key 还能免费创建吗？

可以。Google AI Studio 仍然能创建 Gemini API key。免费创建 key 不等于每个 key 都有独立免费容量，真正要看 project、model 和 AI Studio active limits。

每个 key 都有自己的免费速率限制吗？

没有。rate-limits 文档写明配额按 project 生效，不按 API key 生效。同一 project 下更多 key 不会创造更多 quota。

我的真实免费层限额在哪里看？

看 AI Studio 的 rate-limit view，并确保选中正确 project 和 model。公开文档解释维度；AI Studio 显示当前 project 的实际限制。

哪些 Gemini 模型现在还能免费 API 调用？

Gemini 3.1 Pro API 免费吗？

不免费。pricing 页面把 gemini-3.1-pro-preview 的 Free Tier 标为 Not available。AI Studio 体验不要和后端 API 免费混为一谈。

429 是不是说明免费层被取消了？

免费层能不能用于生产？

适合原型和低风险评估。需要可预测容量、付费数据处理、paid-only 模型、正式用户流量或特定地区合规边界时，应转向 paid services 或更稳定的 route。

实际结论

#Gemini API #免费层 #速率限制 #Google AI #AI Studio

分享文章:

laozhang.ai

一个 API，所有 AI 模型

文档

AI 图片

Gemini 3 Pro Image

$0.05/张

官方2折

AI 视频

Sora 2 · Veo 3.1

$0.15/个

异步API

AI 对话

GPT · Claude · Gemini

200+ 模型

同官方价

已服务 10万+ 开发者·失败不扣费·企业级稳定·支付宝/微信支付

|@laozhang_cn|送$0.1