Si. A fecha del 29 de marzo de 2026, la pricing page de Google sigue mostrando gemini-3.1-flash-live-preview como Free of charge. El model string exacto es gemini-3.1-flash-live-preview y la superficie correcta es Gemini Live API. Si tu pregunta es simplemente “puedo probar Gemini 3.1 Flash Live sin pagar”, la respuesta es si.
Pero esa es solo la primera capa de la respuesta. Google ya no presenta Gemini API como si una sola tabla publica fija fuera el contrato final. La pagina de rate limits actual te manda a AI Studio para ver los active limits, dice que los limites se aplican por proyecto y aclara que los limites publicados no estan garantizados. Ademas, Flash Live sigue siendo un modelo preview, el unpaid usage tiene otra logica de data handling y Google tambien dice que los API clients dirigidos a usuarios de EEA, Switzerland o UK deben usar Paid Services.
Si quieres una regla corta: el camino gratis sirve para evaluacion, demos internas y prototipos de bajo riesgo. No es lo mismo que un contrato de produccion estable para voz.
“Nota de evidencia: esta guia se reviso contra pricing, rate limits, billing, model page, Live API, ephemeral tokens y Gemini API terms de Google el 29 de marzo de 2026.
TL;DR
| Pregunta | Respuesta actual |
|---|---|
| Gemini 3.1 Flash Live sigue siendo gratis en API? | Si. La pricing page sigue mostrando gemini-3.1-flash-live-preview como Free of charge. |
| Eso significa que existe una tabla publica fija y definitiva? | No. Google manda a AI Studio para el live limit real y dice que los limites publicados no estan garantizados. |
| Cual es el model string exacto? | gemini-3.1-flash-live-preview |
| Cual es la API correcta? | Gemini Live API |
| Donde se ve el limite real? | En la vista de rate limits de AI Studio del proyecto exacto que vas a usar. |
| Tiene sentido usar el free en produccion? | Normalmente no. Preview, unpaid data handling y reglas regionales pesan antes que la cuota. |
| Cuanto cuesta cuando sales del free? | text input \$0.75 / 1M, audio input \$3.00 / 1M o \$0.005 / min, image/video input \$1.00 / 1M o \$0.002 / min, text output \$4.50 / 1M, audio output \$12.00 / 1M o \$0.018 / min |
| Camino mas seguro para probarlo? | Confirmar la fila en pricing, mirar AI Studio y empezar server-side; navegador directo solo con ephemeral tokens. |

Que significa hoy que Flash Live sea "gratis"
La forma mas clara de entenderlo es separar el tema en dos preguntas.
Primera pregunta: este modelo sigue siendo gratis en Gemini API?
Hoy, si. Google mantiene una seccion propia para Gemini 3.1 Flash Live Preview en la pricing page, el model code sigue siendo gemini-3.1-flash-live-preview y la columna de Free Tier marca input y output como Free of charge.
Segunda pregunta: cuanto me deja usar mi proyecto ahora mismo?
Eso ya no es algo que Google este presentando como una sola tarjeta publica fija. La pagina de rate limits actual deja claras varias reglas:
- los limites se miden en ejes como RPM, TPM y RPD
- los limites aplican por proyecto, no por API key
- el RPD se reinicia a medianoche en Pacific Time
- los modelos preview y experimental son mas restrictivos
- los rate limits publicados no estan garantizados
Y despues te manda a AI Studio para ver la respuesta viva.
Por eso, en 2026, la pregunta por el Flash Live gratis en realidad son dos preguntas:
- la pricing page confirma que el modelo conserva elegibilidad gratuita
- AI Studio muestra la capacidad viva que ese proyecto tiene ahora
Ese es el cambio de contrato mas importante frente a las guias viejas. Google no esta diciendo que el limite sea incognoscible. Esta diciendo que la elegibilidad gratis y la cuota viva ya no son la misma cosa.
Si tu duda es mas amplia que Flash Live y quieres comparar los modelos gratis de Gemini en conjunto, te conviene leer nuestra guia del plan gratuito de Gemini API. Esa pagina resuelve el mapa general. Esta resuelve la pregunta mas estrecha: si la ruta Live sigue sirviendo como punto de entrada gratis.
El contrato gratis es mucho mas estrecho de lo que parece
Aqui es donde la mayoria de los articulos flojos de “free API” se quedan cortos.
Primero, Flash Live sigue siendo preview.
La model page sigue marcando gemini-3.1-flash-live-preview como Preview y los preview terms dicen que los servicios preview no son para production use. Eso ya debilita bastante la idea de “lo prototipo gratis y luego lo dejo corriendo igual”.
Segundo, el unpaid usage cambia el contrato de datos.
Los terms de Google dicen que cuando usas unpaid services, incluida la unpaid quota de Gemini API, Google puede usar el contenido enviado y las respuestas generadas para provide, improve, and develop sus productos y servicios. La misma documentacion tambien dice que human reviewers pueden leer, anotar y procesar input y output de API.
Eso no significa que el camino gratis sea inutil. Significa que es otro contrato. Para evaluar prompts, montar una demo interna o validar un prototipo de voz de bajo riesgo puede ser suficiente. Para conversaciones sensibles, datos de clientes o un producto que ya necesita una postura de privacidad mas fuerte, normalmente deja de ser el contrato correcto muy pronto.
Tercero, en ciertas regiones el tema queda resuelto desde el principio.
Los terms dicen que los API clients puestos a disposicion de usuarios en EEA, Switzerland o United Kingdom solo pueden usar Paid Services. Asi que aunque la pricing page siga mostrando gratis, para un producto publico ese free ya puede no ser valido.
En la practica, esto se resume asi:
- buen caso para free: evaluacion, tests internos, experimentos de bajo riesgo, prototipos temporales
- mal caso para free: apps de voz publicas, flujos sensibles en privacidad, despliegue europeo de cara al usuario, sistemas que necesitan un contrato de capacidad estable
Por eso “si, sigue siendo gratis” es verdad, pero no es la decision completa.
Que pasa con el coste despues del free y donde estan los multiplicadores reales
Cuando el free deja de alcanzar, el pricing actual de Flash Live es bastante legible:
| Linea de coste | Precio actual |
|---|---|
| Text input | \$0.75 / 1M tokens |
| Audio input | \$3.00 / 1M tokens o \$0.005 / min |
| Image / video input | \$1.00 / 1M tokens o \$0.002 / min |
| Text output | \$4.50 / 1M tokens |
| Audio output | \$12.00 / 1M tokens o \$0.018 / min |
| Search grounding | 5,000 prompts gratis al mes compartidos en Gemini 3, despues \$14 / 1,000 queries |
Lo util aqui es que Google publica precios por minuto, no solo por token. Para un producto de voz eso se acerca mucho mas a la realidad operativa.
Si haces una cuenta rapida de una sesion audio-only de 10 minutos:
- 10 minutos de audio entrante a
\$0.005 / minson aprox. $0.05 - 10 minutos de audio saliente a
\$0.018 / minson aprox. $0.18 - total aproximado: $0.23
Eso no es una frase prefabricada de Google, sino una cuenta directa desde su pricing publicado. Y deja una conclusion practica: cuando el contrato gratis ya no te sirve, paid Flash Live sigue siendo asumible para validacion seria a pequena escala.
- 100 llamadas de 10 minutos salen por aprox. $23
- 1,000 llamadas de 10 minutos salen por aprox. $230
No es el coste all-in final, porque text, search y video pueden sumar mas. Pero si muestra que el salto de free a paid no convierte automaticamente el experimento en algo inviable.
Los multiplicadores que de verdad importan son otros:
El video no es decoracion gratuita.
La documentacion de Live explica que el default turn coverage ahora incluye all video frames. Si tu producto es sobre todo voz y solo a veces necesita camara, mandar video constante es una decision de coste y no solo de UX.
Search grounding deja de ser invisible en cuanto sales del pool gratis.
Los 5,000 free prompts compartidos de Gemini 3 ayudan, pero despues viene \$14 / 1,000 queries. Para un asistente de voz que consulte busqueda con frecuencia, eso ya es una linea real de la factura.
La forma de la sesion tambien importa.
Las sesiones audio-only tienen limite de 15 minutos, y las audio + video de 2 minutos, salvo que implementes session-management. O sea, incluso antes de hablar de free tier, el runtime contract ya cambia cuando tu caso de uso madura.

La forma mas segura de probarlo cabe en 3 pasos
No necesitas construir primero un proyecto enorme para responder si esta ruta sigue valiendo como free API.
Paso 1: confirma la fila del modelo.
Abre la pricing page y mira la seccion Gemini 3.1 Flash Live Preview, no un screenshot viejo. Confirma que el model string sigue siendo gemini-3.1-flash-live-preview y que la columna de Free Tier sigue diciendo Free of charge.
Paso 2: abre AI Studio para ver el limite real.
Usa la vista de rate limits de AI Studio para el proyecto exacto que piensas usar. Google ha movido ahi la respuesta viva. Si cambian el billing state, el account status o el proyecto, esa cuota puede cambiar.
Paso 3: elige el camino de conexion seguro.
Si solo estas validando, empieza server-side. Si despues necesitas browser-direct, el camino seguro documentado por Google son los ephemeral tokens, no exponer una API key de larga vida en el frontend. La guia de ephemeral tokens deja claros tres puntos:
- por ahora son solo para Live API
- el cliente usa el token como si fuera una API key
- por defecto tienes 1 minuto para iniciar una nueva sesion y 30 minutos para seguir enviando mensajes en esa conexion
Con eso ya puedes validar el contrato.
Si tu problema ya no es “gratis o no”, sino migracion, manejo de eventos, SDKs y auth en navegador, ve directo a nuestra guia de Gemini 3.1 Flash Live API. Esa es la pieza correcta para la capa de implementacion.

Cuando quedarse en free, cuando pasar a paid y cuando cambiar de articulo
El error mas comun aqui es tratar esto como una pregunta binaria. En realidad la pregunta correcta es: que contrato encaja con el trabajo que tengo ahora mismo?
Tiene sentido seguir con Flash Live gratis cuando, en general, se cumplen estas condiciones:
- sigues evaluando si el modelo encaja
- el workload es de bajo riesgo
- el despliegue es interno, temporal o claramente de prototipo
- la sensibilidad de los datos permite aceptar el contrato de unpaid services
- no estas lanzando un API client publico para usuarios de EEA, Switzerland o UK
Tiene sentido moverse a Flash Live paid cuando la ruta tecnica sigue siendo la correcta, pero el contrato gratis ya no:
- necesitas una postura de privacidad mas limpia
- necesitas una ruta operativa respaldada por billing
- estas superando la capacidad de evaluacion gratis
- quieres probar trafico mas parecido a produccion sin tratar el free limit actual de AI Studio como si fuera un contrato duradero
Y conviene ir a otro articulo cuando la pregunta ya cambio:
- si comparas las rutas gratis de Gemini en general, lee Gemini API free tier
- si necesitas setup, migracion o session design de Flash Live, lee Gemini 3.1 Flash Live API
- si el problema ya no es free voice y lo que de verdad necesitas es una ruta de reasoning paid mas fuerte, lee Gemini 3.1 Pro API
Este ultimo punto importa mucho. Mucha gente cree que necesita “el free Flash Live API”, cuando en realidad lo que necesita es una forma barata de validar un modelo de voz o, directamente, otra ruta de pago. Flash Live esta pensado para real-time, low-latency, voice-first. Si tu trabajo no tiene esa forma, elegirlo solo porque sigue siendo gratis suele ser el error inicial.

FAQ
Gemini 3.1 Flash Live es gratis solo en AI Studio o tambien en la API?
Tambien en la API. A fecha del 29 de marzo de 2026, la pricing page de Google sigue marcando gemini-3.1-flash-live-preview como Free of charge dentro de Gemini API.
Donde veo el limite real de mi cuenta?
En AI Studio, no en una tabla fija universal. La documentacion actual de rate limits te manda alli y ademas dice que los limites publicados no estan garantizados.
Puedo usar la ruta gratis en produccion?
No es una suposicion segura. Flash Live sigue siendo preview, y los preview terms dejan claro que los servicios preview no son para production use. Muchas veces el contrato deja de servir antes de que la cuota sea el problema.
Puedo llamar Flash Live directamente desde el navegador?
Si, pero el camino seguro es emitir ephemeral tokens desde tu backend y usarlos para la sesion de Live API. No expongas una API key de larga vida en el frontend.
Si sigue siendo gratis, puedo ignorar el paid pricing por ahora?
No. El paid pricing te dice que pasa cuando el experimento se convierte en workflow real. En Flash Live esa transicion es bastante legible porque Google publica costes por minuto.
Conclusion practica
Gemini 3.1 Flash Live sigue siendo hoy una ruta con elegibilidad gratuita real dentro de Gemini API. Eso es cierto. Pero la respuesta completa es esta:
- la pricing page te dice si el modelo sigue siendo gratis
- AI Studio te dice que cuota viva tiene tu proyecto ahora
- los terms te dicen si ese contrato gratis encaja de verdad en privacidad, preview y despliegue regional
Por eso la recomendacion correcta no es “sigue gratis, asi que ya esta”. La recomendacion correcta es:
Usa Flash Live gratis para aprender, validar y prototipar. En cuanto necesites un contrato de produccion en lugar de una via de evaluacion, pasa a paid o a otra ruta.
