可以。截至 2026 年 3 月 29 日,Google 的 pricing page 仍然把 gemini-3.1-flash-live-preview 标成 Free of charge。准确模型就是 gemini-3.1-flash-live-preview,接入面则是 Gemini Live API。如果你的问题只是“我现在还能不能不付费试用 Gemini 3.1 Flash Live”,答案是 可以。
但这只是第一层答案。Google 已经不再把一张公开固定限额表当成 Gemini API 的最终合同。当前的 rate-limits 页面 会把你引到 AI Studio 去看 active limits,明确写了限额按 project 生效,也明确提醒公开写出来的 limits 不保证就是你当下项目能拿到的容量。再加上 Flash Live 仍然是 preview 模型,未付费额度的数据处理规则不同,而且 Google 还规定面向 EEA、Switzerland、UK 用户开放的 API client 必须使用 paid services,所以“它是免费 API”这句话远远不够。
如果你只想先拿一个可执行判断,那就是:免费路径适合评估、内部 demo、低风险原型,不适合直接当成稳定的生产语音合同。
“证据说明:本文基于 Google 的 pricing、rate limits、billing、model page、Live API、ephemeral tokens 与 Gemini API terms 页面,在 2026 年 3 月 29 日 重新核对。
TL;DR
| 问题 | 当前答案 |
|---|---|
| Gemini 3.1 Flash Live 在 API 里还免费吗? | 是。Google 的 pricing page 仍把 gemini-3.1-flash-live-preview 标为 Free of charge。 |
| 这是不是意味着有一张固定公开限额表可以直接当合同? | 不是。Google 现在把精确 live limits 的答案交给 AI Studio,而且明确说 specified limits are not guaranteed。 |
| 准确模型字符串是什么? | gemini-3.1-flash-live-preview |
| 我真正用的是哪个接口面? | Gemini Live API |
| 真实限额去哪里看? | 去你实际要用的 project 对应的 AI Studio rate-limit 页面。 |
| 免费层适合直接上生产吗? | 通常不适合。它还是 preview,未付费额度有不同的数据处理规则,而且部分地区的 user-facing client 必须用 paid services。 |
| 超出免费之后多少钱? | text input \$0.75 / 1M,audio input \$3.00 / 1M 或 \$0.005 / 分钟,image/video input \$1.00 / 1M 或 \$0.002 / 分钟,text output \$4.50 / 1M,audio output \$12.00 / 1M 或 \$0.018 / 分钟。 |
| 最安全的试用路径是什么? | 先确认 pricing row,再去 AI Studio 看 live limits,然后优先 server-side;浏览器直连只走 ephemeral tokens。 |

现在说 Flash Live“免费”,到底指什么
理解这个问题,最好先拆成两个问题。
第一,它现在是不是仍然属于 Gemini API 里可免费试用的模型?
当前答案是是。Google 的 pricing page 有单独的 Gemini 3.1 Flash Live Preview 区块,模型代码写的是 gemini-3.1-flash-live-preview,而且 Free Tier 列里,输入和输出都还是 Free of charge。
第二,我的 project 此刻到底有多少可用容量?
这个答案,Google 现在不鼓励你从博客文章里抄。当前的 rate-limits 页面写得很明确:
- 限额通常按 RPM、TPM、RPD 等维度计算
- 限额是按 project,不是按 API key
- RPD 在 Pacific Time 午夜重置
- preview / experimental 模型限制更紧
- specified rate limits 不保证
然后它直接把你引到 AI Studio 去看 live answer。
所以 2026 年的 Flash Live 免费问题,真正应该拆成:
- pricing page 证明它仍然有免费资格
- AI Studio 告诉你这个 project 现在到底能用多少
这也是为什么旧式“免费额度大表格”越来越不可靠。Google 并不是说限额完全不可知,而是说:模型资格看公开页面,项目容量看 AI Studio。
如果你的问题已经不只是 Flash Live,而是想看 Gemini 整体哪些模型现在还能免费调 API,可以直接看我们的 Gemini API 免费额度指南。那篇更适合做全局模型筛选;这篇更适合回答“语音这条 Live 路线现在还能不能当免费 API 起点”。
免费合同比“Free of charge”这几个字窄得多
很多“免费 API”文章真正容易误导人的地方就在这里。
第一,Flash Live 仍然是 preview。
Google 的 model page 仍然把 gemini-3.1-flash-live-preview 标为 Preview,而 preview terms 明确写了 preview services 不能用于 production use。这已经足够让“先用免费版做出来,再悄悄一直跑在生产上”这套想象变得站不住脚。
第二,未付费额度的数据处理规则不同。
Google 的 terms 说明,当你使用 unpaid services,包括 Gemini API 的 unpaid quota 时,Google 可以使用你提交的内容和模型响应来 provide, improve, and develop Google 的产品与服务;同一部分 terms 也写了 human reviewers 可能会读取、标注和处理 API input 与 output。
这不意味着免费路径完全不能用。它意味着合同变了。做 prompt 验证、内部演示、低风险原型,这个边界也许能接受;但如果你处理的是客户对话、内部敏感资料,或者你一开始就需要更强的数据隔离叙事,那么免费合同往往已经不合适。
第三,一些地区的 user-facing 部署一开始就不能走免费合同。
Google 的 terms 直接写了:如果你的 API client 面向 European Economic Area、Switzerland、United Kingdom 的用户开放,就只能使用 Paid Services。所以即便 pricing page 还写着免费,这条路径也不代表它适合公开上线。
用一句话概括就是:
- 适合继续免费:评估、内部实验、低风险原型、短期验证
- 不该继续免费:公开语音产品、隐私敏感流程、欧洲面向用户部署、需要稳定容量承诺的系统
这也是为什么“它还免费”虽然是真的,但远远不是全部答案。
超出免费之后,多少钱,以及哪些地方最容易被低估
一旦免费不够,Google 当前给 Flash Live 的付费价格其实并不难算:
| 计费项 | 当前价格 |
|---|---|
| Text input | \$0.75 / 1M tokens |
| Audio input | \$3.00 / 1M tokens 或 \$0.005 / 分钟 |
| Image / video input | \$1.00 / 1M tokens 或 \$0.002 / 分钟 |
| Text output | \$4.50 / 1M tokens |
| Audio output | \$12.00 / 1M tokens 或 \$0.018 / 分钟 |
| Search grounding | Gemini 3 共享每月 5,000 个免费 prompts,之后 \$14 / 1,000 queries |
这里真正有价值的是 minute-based 价格。对实时语音团队来说,按分钟比按 token 更接近真实运营判断。
做一个 audio-only 的粗算:
- 10 分钟输入音频,按
\$0.005 / 分钟,大约 $0.05 - 10 分钟输出音频,按
\$0.018 / 分钟,大约 $0.18 - 所以一个 10 分钟双向语音会话,纯音频基线大约是 $0.23
这不是 Google 原文现成的一句话,而是从它公开的 minute-based pricing 直接算出来的。所以一旦免费合同不再适合,付费 Flash Live 也并不是不能承受的小规模验证成本:
- 100 通 10 分钟电话,大约 $23
- 1,000 通 10 分钟电话,大约 $230
这当然不是最终全包成本,因为 text、search、video 还会继续叠加。但它足够说明一件事:当你已经确认免费合同不对时,付费 Live 路线并没有贵到完全不能做严肃验证。
真正容易被低估的,是下面三个乘数:
视频不是“顺手带上”就没有成本。
Live 文档里写得很清楚,默认 turn coverage 会包含 all video frames。如果你的产品核心其实是语音,视频只是偶尔辅助,那就应该比“摄像头全程推流”更克制。
Search grounding 在超过免费共享额度后是真正的额外成本线。
当前 5,000 个免费 grounded prompts 用完之后,\$14 / 1,000 queries 不是天价,但也绝不是零。对高频客服、语音陪练或搜索型助手,这会逐渐变成真实账单。
会话时长本身就是运行时约束。
当前 audio-only sessions 默认限制 15 分钟,audio + video sessions 默认限制 2 分钟,除非你采用 session-management 技术。也就是说,即便不谈免费额度,你把原型变成长会话产品时,也已经进入另一套运营问题。

最安全的试用方式:3 步够了
你不需要先搭一个大工程,才能判断“这条免费路线现在还能不能用”。
第 1 步:确认当前 model row。
打开 pricing page,直接看 Gemini 3.1 Flash Live Preview 这一行,而不是看缓存截图。确认模型字符串还是 gemini-3.1-flash-live-preview,Free Tier 列仍然写着 Free of charge。
第 2 步:去 AI Studio 看项目真实限额。
打开 AI Studio rate-limit 页面,切到你实际要用的 project。Google 自己现在就是把 active limits 的答案放在那里。只要 billing 状态、account 状态或者 project 变了,能拿到的 live limits 就可能跟着变。
第 3 步:选择安全的连接方式。
如果你现在只是验证模型,优先走 server-side。以后如果必须浏览器直连,Google 提供的安全路径是 ephemeral tokens,而不是把长期 API key 暴露在前端。ephemeral-token 文档写了三件关键事:
- 它目前只适用于 Live API
- client 会把 token 当成 API key 一样使用
- 默认时序是 1 分钟内启动新 session,连接建立后 30 分钟内持续发送消息
这三步已经足够回答“现在还能不能把 Flash Live 当免费 API 试起来”。
如果你已经确认免费不是问题,真正需要的是更完整的接入、迁移、事件处理、浏览器认证方案,那就直接去看我们的 Gemini 3.1 Flash Live API 指南。那篇更适合回答实现层问题。

什么时候继续免费,什么时候转付费,什么时候该看别的文章
这个话题最容易犯的错,就是把它理解成一个简单的是非题。它其实不是“免费还是付费”,而是“现在这份合同适不适合你手上的工作”。
继续用 免费 Flash Live,通常意味着这些条件大体成立:
- 你还在验证模型是否适合
- 工作负载风险较低
- 场景是内部 demo、临时原型、短期实验
- 数据敏感度足够低,可以接受 unpaid-service 边界
- 你不是在做面向 EEA / Switzerland / UK 用户的公开 API client
转去 付费 Flash Live,通常意味着技术路线仍然对,但免费合同已经不对了:
- 你需要更清晰的数据隐私叙事
- 你需要 billing-backed 的运营路径
- 你正在超出免费验证容量
- 你想用更接近真实生产的流量去验证,而不是把 AI Studio 当前免费额度误当成长久合同
当问题本身变了,就该看别的文章:
- 如果你现在是在比较 Gemini 整体的免费模型路线,去看 Gemini API 免费额度指南
- 如果你需要 Flash Live 的接入、迁移、会话设计,去看 Gemini 3.1 Flash Live API 指南
- 如果你不再纠结“免费语音”,而是其实需要更强的付费 reasoning 路线,去看 Gemini 3.1 Pro API 指南
最后这个判断非常关键。很多人以为自己要找的是“免费 Flash Live API”,但真正的问题可能只是“我需要一个低成本验证语音模型的入口”,或者“我其实该选的是另一条付费模型路线”。Flash Live 的定位非常明确:它是 实时、低延迟、voice-first 的接口。如果你的工作负载不是这个形状,只是因为它“免费”就强行选它,往往是错误的开始。

FAQ
Gemini 3.1 Flash Live 是只在 AI Studio 免费,还是 API 里也免费?
截至 2026 年 3 月 29 日,Google 的 pricing page 仍然把 gemini-3.1-flash-live-preview 标成 Free of charge,所以它不是只有 AI Studio playground 才免费,Gemini API 这条路上也仍有免费资格。
我的真实限额去哪里看?
去 AI Studio,不是去抄一张固定表。Google 当前的 rate-limits 文档明确要求在那里看 active limits,而且公开写出来的 limit 不保证就是你项目的最终容量。
免费路线可以直接上生产吗?
不应该默认这么理解。Flash Live 仍然是 preview,而 preview terms 明确说 preview services 不能用于 production use。很多时候,还没等免费额度不够,合同本身就已经不适合。
浏览器端能不能直接调?
可以,但正确路径是后端签发 ephemeral token,再让 client 去连 Live API。不要把长期 API key 直接放到浏览器里。
既然还有免费,我是不是可以先不看付费价格?
不应该。付费价格告诉你,一旦实验变成真实工作流,成本会长成什么样。对 Flash Live 来说,minute-based 定价已经足够直接,你应该尽早知道超出免费之后会发生什么。
最后的结论
Gemini 3.1 Flash Live 到今天仍然是真正有免费资格的 Gemini API 路线,这一点是真的。但更完整的答案是:
- pricing page 告诉你它有没有免费资格
- AI Studio 告诉你这个 project 当下实际有多少容量
- terms 告诉你这份免费合同在隐私、预览状态、地区部署上到底合不合适
所以正确建议不是“它还免费,直接上”。正确建议是:
用免费 Flash Live 去学习、验证、做原型。一旦你需要的是生产合同,而不是免费实验入口,就转付费,或者转到更合适的路线。
