Gemini API 免费层在 2026 年仍然存在,但你的 quota 面板、报错上下文或近期讨论里出现 “20 RPD” 时,不能直接把它当成上线限制。它说明当前 project 可能处在很小的免费额度桶里,而不是 Google 给所有项目承诺的一张固定公开表。Google 的 pricing 页面告诉你目标模型和调用方式是否还属于 Free Tier;AI Studio 才告诉你当前这个 project、模型、区域和 billing 状态下真正能用的 active limits。先看这两个入口,再决定是否换模型、压低并发、转付费、准备 prepay 余额,或者申请更高 quota。新建更多 API key 通常不是答案,因为同一个 Google Cloud project 里的 key 共用同一个配额池。
先说结论
| 问题 | 2026 年 5 月 3 日的可发布答案 |
|---|---|
| Gemini API 还有免费层吗? | 有。Google pricing 页面仍然给若干 Gemini Developer API 路线标出 Free Tier。 |
| 20 RPD 免费层限制是真的吗? | 它可能对某个 project、model 或账号状态真实存在,但不是可以写进代码的通用额度。真正可用的 RPD 要在 AI Studio 里按 project、model、tier 和 billing state 查看。 |
| 有没有一个可以写进代码的公开固定限额? | 没有。公开文档解释 RPM、TPM、RPD 和 project 级规则,实际 active limits 要看 AI Studio。 |
| 多个 API key 会增加免费额度吗? | 不会。同一 project 下多个 key 共享同一个 quota bucket。 |
| 哪些路线现在可以先按免费资格评估? | 先查 pricing。当前可见的免费输入/输出路线包括 gemini-3-flash-preview、gemini-3.1-flash-lite-preview、gemini-3.1-flash-live-preview、gemini-2.5-pro、gemini-2.5-flash 和 gemini-2.5-flash-lite 的合格 serving mode。 |
| 哪些路线不应该叫免费 API? | gemini-3.1-pro-preview、Gemini 3 Pro Image Preview、Gemini 3.1 Flash Image Preview、Imagen、Veo,以及很多 Batch/Flex/Image 路线在 Free Tier 栏里是 Not available。 |
| 遇到 429 先做什么? | 先确认调用面、project、model、serving mode 和 AI Studio quota,再判断是 RPM、TPM、RPD、突发并发、billing、模型资格还是 provider route 的限制。 |
事实复核:本文在 2026 年 5 月 3 日核对了 Google rate limits、pricing、billing、API key 和 terms 文档,并重新确认了 20 RPD 的边界。价格、模型资格和限额都是易变事实,上线前要重新查看官方页面和 AI Studio。
最大变化不在数字,在答案入口
很多旧文章会直接给一张 “Gemini API 免费额度表”。只问 “20 RPD” 本质上也是想把当前额度压成一个固定数字。这种表最多只能当历史快照,不能当 2026 年的上线合同。现在要把两个问题拆开:
- 目标模型和 serving mode 有没有 Free Tier 资格。
- 你的 project 今天在 AI Studio 里实际显示多少 RPM、TPM、RPD 或其他模型维度。
Gemini API rate-limits 文档 仍然解释了最重要的机制:限制会按 requests per minute、tokens per minute、requests per day 等维度生效;只要其中一个维度超限,就可能触发错误;RPD 按太平洋时间午夜重置;quota 按 project 而不是按 API key 生效。它的价值是规则说明,不是替你承诺每个账号的最终容量。
真正可执行的做法是把 Gemini pricing 页面 当作模型资格入口,把 AI Studio rate-limit view 当作实时 project quota 入口。只要旧表或被反复引用的数字和这两个入口冲突,旧表就不能作为决策依据。

现在 Gemini API 里到底哪些模型还免费?
模型资格是第一道门。如果目标模型本来就没有 Free Tier,后面讨论每分钟多少次请求没有意义。

| 路线 | 免费层状态怎么读 | 实际含义 |
|---|---|---|
gemini-3.1-flash-lite-preview | pricing 当前在多个 serving mode 里列出 free input/output。 | 适合成本敏感的文本、多模态和高频原型,但 preview 限额会更紧、更易变。 |
gemini-3.1-flash-live-preview | Live API 路线当前列出免费输入/输出。 | 这是实时音频/Live API 合同,不等同于普通文本请求。 |
gemini-3-flash-preview | Standard/Priority 当前有 Free Tier,Batch/Flex 不能直接按免费理解。 | 适合一般 3 系能力原型,但 serving mode 会改变资格。 |
gemini-2.5-pro | Standard/Priority 当前有 Free Tier。 | 当 3.1 Pro API paid-only 时,它仍是强推理的免费 fallback。 |
gemini-2.5-flash / gemini-2.5-flash-lite | 当前仍有免费输入/输出路线。 | 适合低风险原型、教学、成本测试和小流量工具。 |
gemini-3.1-pro-preview | Free Tier 显示 Not available。 | AI Studio 试用不等于后端 API 免费调用。需要这条路线时,先读 Gemini 3.1 Pro free API 边界。 |
| 图像、Imagen、Veo 等路线 | 多数 API 图像/视频路线当前不是 Free Tier。 | 不要把 AI Studio 体验、促销演示和 API 免费后端混成一个结论。 |
这张表故意不是 quota 表。它只回答“有没有资格开始免费评估”。一个模型可以免费合格,但你的 project active limit 仍然很低;一个模型可以出现在 AI Studio 里,但 API 后端仍是 paid-only;一个 preview 模型今天能用,也可能在下一次发布或限额调整后变得更严格。
为什么新 API key 不会增加配额
API key 是访问凭证,quota bucket 属于 project。这个边界必须写在免费层文章前半部分,因为很多人看到 429 后第一反应是“再创建几个 key”。如果这些 key 仍然挂在同一个 Google Cloud project 下,它们只是同一个限额池的多个入口。
只有在真实所有权不同的时候,才应该拆 project:例如 staging 和 production 由不同 billing owner 管理;团队权限、审计和安全边界不同;地区、合规或客户隔离要求不同;或者你确实需要分别监控用量和成本。为了绕过免费层 cap 而拆 project,既不稳定,也容易把诊断做乱。
所以遇到速率限制时,正确问题不是“还能开几个 key”,而是:
- 这个 key 是否属于我以为的 project?
- 这个 project 是否绑定了正确 billing account?
- 目标 model 和 serving mode 是否仍然 free-capable?
- 当前 RPM、TPM、RPD 哪个维度先被打满?
- 这个 workload 是否应该改成 queue、cache、token cap、paid tier 或官方 quota increase?
如果答案已经指向容量问题,就不要用 key rotation 假装修复。
Billing 和预付费可能才是隐藏限制
付费层也不能再简单理解成“绑卡就结束”。Google 的 billing 文档 把 Prepay 和 Postpay 计划拆开,并说明新的 billing plan 系统从 2026 年 3 月 23 日开始生效。
真正需要检查的是:project 是否已经绑定 billing account;AI Studio 是否要求 set up billing 或 set up prepay;billing account 是否还有余额;账户是在 Prepay 还是 Postpay;是否设置 auto-reload;当前 tier 是否支持你期待的容量。Prepay 尤其关键,因为余额归零可能让挂在同一个 billing account 下的 Gemini API 服务一起停掉。
如果你只是想看从 key 创建到 tier 检查的界面路径,可以接着读 Gemini API key 与 Tier 3 指南。对免费层速率限制来说,billing 的角色很清楚:它是容量、数据条款和可持续服务的边界,不是免费层速率限制的魔法开关。
上线前如何确认实时限额
把这套检查当成每次正式原型、demo 或上线前的短流程:
- 打开 pricing 页面,确认目标模型和 serving mode 仍有 Free Tier。
- 打开 AI Studio,切到真正准备调用的 project。
- 在 rate-limit view 里记录 RPM、TPM、RPD,以及模型可能额外出现的维度。
- 确认 project 的 billing 状态、prepay 或 postpay 状态、余额和 billing account tier。
- 记录 model、project、region、billing state、timestamp 和看到的 limit。
- 一旦切换模型、project、region、billing account、serving mode 或流量形态,就重新检查。
这一步看起来很机械,却能避免大多数错误架构。如果 AI Studio 显示 RPD 不足以支撑 demo day,修复不是复制旧表,也不是新建 key,而是排队、换模型、降低输出、转 paid tier 或准备 quota increase。
429 在免费层里真正意味着什么
429 不是“免费层没了”的证据,也不是“立刻付费”这一种答案。它说明某个 owner 先拦住了请求。

| 步骤 | 要确认什么 | 为什么重要 |
|---|---|---|
| 调用面 | 官方 Gemini API、AI Studio UI,还是第三方 provider。 | provider 429 不一定是 Google project quota。 |
| project 与 key | key 所属 project、key restriction、billing account 是否一致。 | 混用 project 会让观察到的 limit 看起来互相矛盾。 |
| model 与 serving mode | model ID、Standard/Batch/Flex/Priority、preview 状态、region。 | 免费资格和限额按模型与模式变化。 |
| AI Studio quota | RPM、TPM、RPD、reset window、usage 和额外维度。 | 这里决定是哪一个 owner 触发。 |
| 降低压力 | 降并发、排队、缓存、缩短 prompt、限制 max output、加入 jittered backoff。 | 真正的 rate-limit 修复通常先改变流量形态。 |
| 带证据升级 | 记录 project、model、时间、当前 limit、用量曲线和已尝试修复。 | 申请提高限额或找支持时,需要事实包。 |
如果你已经确认错误属于更一般的 API 限流,而不是免费资格,可以继续看 Gemini API rate limits guide 和 Gemini API 错误排查指南。
什么时候免费层够用,什么时候不够
免费层适合评估,不适合承诺基础设施。它很适合 prompt exploration、课程示例、低风险 PoC、内部 demo、个人工具、模型比较、早期成本测试和短期 agent 原型。即使是这些场景,也应该从第一天就写 queue、cache、token cap、429 logging 和 backoff。这样以后转付费或换 provider 时,不需要推翻架构。
免费层不适合的场景也很明确:需要 predictable capacity、付费模型、真实客户数据处理、生产支持预期,或者在 EEA、瑞士、英国面向用户提供 API client。Google 的 Gemini API terms 对 unpaid services 和 paid services 的数据使用边界不同;未付费使用可以被用于改进 Google 产品,并可能有人审处理输入输出。对客户数据或正式产品来说,这不是脚注,而是上线边界。
第三方 fallback 应该放在哪里
官方 Google 路线必须先查清楚。只有当你已经知道官方路线无法满足容量、地区、模型、billing、稳定性或兼容性要求时,fallback provider 或多模型网关才有意义。
如果团队需要一个跨 provider 的兼容网关,可以把 laozhang.ai 放在后置评估位:先确认官方 Gemini 模型是否 free-capable,再确认 AI Studio 中这个 project 的真实 quota,再减少可避免的 429,最后决定 paid tier、quota increase 或 provider fallback。不要把 provider 当作当前官方事实的替代品。模型覆盖、价格、延迟、服务范围都属于易变事实,真正切流前要在 provider dashboard 里验证。
上线检查清单

- Pricing 页面确认目标 model 与 serving mode 仍然 free-capable。
- AI Studio 对同一个 project 和 model 显示的 active quota 足够。
- API key 属于预期 project,没有混用 staging、demo 或个人项目。
- billing 状态、prepay 余额和 billing account owner 已经明确。
- 请求代码有 queue、jittered backoff、token cap 和 429 owner logging。
- dashboard 能区分 RPM、TPM、RPD、billing failure 和 provider failure。
- unpaid quota 中发送的数据符合 unpaid-service terms。
- EEA、瑞士、英国用户面向场景走 paid services。
- 用户流量依赖容量前,已经有 paid-tier、quota-increase 或 fallback-route 决策。
FAQ
Gemini API key 还能免费创建吗?
可以。Google AI Studio 仍然能创建 Gemini API key。免费创建 key 不等于每个 key 都有独立免费容量,真正要看 project、model 和 AI Studio active limits。
每个 key 都有自己的免费速率限制吗?
没有。rate-limits 文档写明配额按 project 生效,不按 API key 生效。同一 project 下更多 key 不会创造更多 quota。
我的真实免费层限额在哪里看?
看 AI Studio 的 rate-limit view,并确保选中正确 project 和 model。公开文档解释维度;AI Studio 显示当前 project 的实际限制。
哪些 Gemini 模型现在还能免费 API 调用?
答案随模型和 serving mode 变化。2026 年 5 月 2 日,pricing 页面仍给多个路线列出免费输入/输出,包括 Gemini 3.1 Flash-Lite Preview、Gemini 3.1 Flash Live Preview、Gemini 3 Flash Preview、Gemini 2.5 Pro、Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite。上线前仍要复核。
Gemini 3.1 Pro API 免费吗?
不免费。pricing 页面把 gemini-3.1-pro-preview 的 Free Tier 标为 Not available。AI Studio 体验不要和后端 API 免费混为一谈。
429 是不是说明免费层被取消了?
通常不是。429 说明某个活跃限制被打满,可能是 RPM、TPM、RPD、突发并发、模型资格、billing、project scope 或 provider route。先查 AI Studio 和日志,再改架构。
免费层能不能用于生产?
适合原型和低风险评估。需要可预测容量、付费数据处理、paid-only 模型、正式用户流量或特定地区合规边界时,应转向 paid services 或更稳定的 route。
实际结论
Gemini API 免费层仍然真实存在,但它不是一张全网通用的静态 quota 表,也不会因为你多开几个 API key 而变多。正确顺序是:pricing 页面判断模型资格,AI Studio 判断当前 project 的 live quota,billing 页面判断容量和 prepay,terms 判断数据使用与地区上线边界。这个顺序比任何复制来的 RPM/RPD 数字更有用,因为它回答的是你的项目今天能不能安全运行,以及上线前到底该改哪一层。
