본문으로 건너뛰기

Gemini 3.1 Flash Live 무료 API: 2026년에도 정말 무료인가?

A
12 분 소요API 가이드

Gemini 3.1 Flash Live는 2026년 3월 말에도 Gemini API에서 무료로 표시되지만, 그건 답의 첫 층일 뿐입니다. 실제로 무엇이 무료인지, 한도는 어디서 보고, 언제 무료 계약이 더 이상 맞지 않는지 정리합니다.

Gemini 3.1 Flash Live 무료 API: 2026년에도 정말 무료인가?

됩니다. 2026년 3월 29일 기준 Google의 pricing page는 gemini-3.1-flash-live-preview 를 여전히 Free of charge 로 표시합니다. 정확한 모델 문자열은 gemini-3.1-flash-live-preview, 실제 API 표면은 Gemini Live API 입니다. 질문이 단순히 “지금도 돈 안 내고 Gemini 3.1 Flash Live를 시험할 수 있나”라면 답은 입니다.

하지만 그건 첫 번째 답일 뿐입니다. Google은 이제 Gemini API를 하나의 고정 공개 한도표로 설명하지 않습니다. 현재 rate-limits 페이지는 active limits를 AI Studio에서 보라고 안내하고, 제한이 project 단위로 걸리며, 공개된 limit가 보장값이 아니다라고 분명히 적습니다. 여기에 Flash Live가 여전히 preview 모델이라는 점, unpaid usage에 다른 데이터 처리 규칙이 적용된다는 점, 그리고 EEA, Switzerland, UK 사용자를 위한 API client는 paid services 를 써야 한다는 조항까지 합쳐지면, “무료 API다”라는 한 줄로는 현실을 설명할 수 없습니다.

한 문장으로 정리하면 이렇습니다. 무료 경로는 평가, 내부 데모, 저위험 프로토타입에는 맞지만, 그대로 안정적인 음성 프로덕션 계약은 아닙니다.

근거 메모: 본문은 pricing, rate limits, billing, model page, Live API, ephemeral tokens, Gemini API terms를 2026년 3월 29일 기준으로 다시 확인한 내용입니다.

TL;DR

질문현재 답
Gemini 3.1 Flash Live는 API에서 아직 무료인가?예. pricing page에서 gemini-3.1-flash-live-preview 가 여전히 Free of charge 로 표시됩니다.
그 말이 고정 공개 한도표가 있다는 뜻인가?아니오. Google은 정확한 live limits를 AI Studio에서 보라고 하고, 공개된 limit는 보장되지 않는다고 밝힙니다.
정확한 모델 문자열은?gemini-3.1-flash-live-preview
실제 API 표면은?Gemini Live API
실제 한도는 어디서 보나?실제로 사용할 project의 AI Studio rate-limit view
무료 그대로 본판 운영해도 되나?보통은 아니다. preview 상태, unpaid data handling, 지역 규칙이 먼저 걸림돌이 된다.
무료 이후 가격은?text input \$0.75 / 1M, audio input \$3.00 / 1M 또는 \$0.005 / 분, image/video input \$1.00 / 1M 또는 \$0.002 / 분, text output \$4.50 / 1M, audio output \$12.00 / 1M 또는 \$0.018 / 분
가장 안전한 시험 경로는?pricing row 확인 -> AI Studio에서 live limits 확인 -> 우선 server-side, 브라우저는 ephemeral tokens

Flash Live 무료 접근이 pricing 자격, AI Studio 한도, 계약 경계에 달려 있음을 설명하는 이미지

지금 Flash Live에서 “무료”라는 말이 실제로 뜻하는 것

이 문제는 두 층으로 나눠서 보는 것이 가장 정확합니다.

첫째, 이 모델이 지금도 Gemini API에서 무료 대상인가?
현재는 그렇습니다. Google의 pricing page에는 Gemini 3.1 Flash Live Preview 섹션이 따로 있고, model code는 gemini-3.1-flash-live-preview 로 표시되며, Free Tier 열에서 input과 output 모두 Free of charge 로 남아 있습니다.

둘째, 내 project가 지금 이 순간 실제로 얼마만큼 쓸 수 있는가?
이건 더 이상 블로그 글 한 편이 고정 숫자로 말할 수 있는 영역이 아닙니다. 현재 rate-limits 페이지는 다음을 분명히 말합니다.

  • 제한은 RPM, TPM, RPD 같은 축으로 평가된다
  • 제한은 API key가 아니라 project 단위
  • RPD는 Pacific Time 자정에 초기화된다
  • preview / experimental 모델은 더 강하게 제한된다
  • specified rate limits는 보장되지 않는다

그리고 마지막 답은 AI Studio에서 확인하라고 안내합니다.

즉 2026년의 Flash Live 무료 질문은 사실 두 가지입니다.

  1. pricing page가 “이 모델은 아직 무료 자격이 있다”고 말해 준다
  2. AI Studio가 “이 project가 지금 실제로 받는 사용 가능 용량”을 보여 준다

여기서 오래된 고정 표 사고방식과 갈립니다. Google이 지금 제시하는 계약은 무료 자격실제 사용 가능 용량을 한 장의 공개 표로 약속하지 않는 구조입니다.

질문이 Flash Live 하나가 아니라 Gemini 전체 무료 경로 비교라면 Gemini API 무료 티어 가이드를 보는 편이 낫습니다. 그 글은 모델 전체 지도, 이 글은 Live 경로의 무료 계약 판단에 더 가깝습니다.

무료 계약은 라벨보다 훨씬 좁다

“무료 API”라는 말만 보고 가장 많이 놓치는 부분이 여기입니다.

첫째, Flash Live는 아직 preview다.
model page에서도 gemini-3.1-flash-live-preview 는 Preview로 표시되고, preview terms는 preview services를 production use에 쓰지 말라고 명시합니다. 이것만으로도 무료 경로를 곧바로 운영 계약처럼 보는 해석은 약해집니다.

둘째, unpaid usage는 데이터 처리 계약이 다르다.
Google terms는 Gemini API의 unpaid quota를 포함한 unpaid services를 사용할 때, 입력과 생성 응답이 Google 제품과 서비스를 provide, improve, and develop 하는 데 사용될 수 있다고 설명합니다. 같은 문서에는 human reviewers가 API input / output을 읽고 처리할 수 있다는 내용도 있습니다.

이 말이 무료 경로가 무조건 금지라는 뜻은 아닙니다. 뜻은 더 단순합니다. 무료는 다른 계약이라는 것입니다. 프롬프트 검증, 내부 음성 데모, 저위험 프로토타입에는 괜찮을 수 있지만, 민감한 고객 데이터나 더 강한 개인정보 보호 요구 수준이 필요한 워크로드에는 보통 빨리 한계가 옵니다.

셋째, 특정 지역의 user-facing 배포는 처음부터 무료 경로가 맞지 않는다.
Google terms는 EEA, Switzerland, UK 사용자를 대상으로 API client를 제공할 때는 Paid Services 만 사용할 수 있다고 적습니다. pricing page에 무료라고 적혀 있어도, 공개 제품의 계약으로는 이미 부적합할 수 있다는 뜻입니다.

실무적으로는 이렇게 정리할 수 있습니다.

  • 무료 유지가 맞는 경우: 평가, 내부 테스트, 저위험 실험, 짧은 프로토타입
  • 무료를 그만둬야 하는 경우: 공개 음성 앱, 개인정보 민감도가 높은 워크플로, 유럽 사용자 대상 배포, 안정적인 처리 용량 계약이 필요한 시스템

그래서 “아직 무료다”는 사실이지만, 그것만으로는 의사결정이 끝나지 않습니다.

무료를 넘긴 뒤의 가격과 실제로 조심해야 할 비용 요인

free가 더 이상 맞지 않을 때 Flash Live의 현재 유료 가격은 꽤 읽기 쉽습니다.

과금 항목현재 가격
Text input\$0.75 / 1M tokens
Audio input\$3.00 / 1M tokens 또는 \$0.005 / 분
Image / video input\$1.00 / 1M tokens 또는 \$0.002 / 분
Text output\$4.50 / 1M tokens
Audio output\$12.00 / 1M tokens 또는 \$0.018 / 분
Search groundingGemini 3 공유 월 5,000 free prompts, 이후 \$14 / 1,000 queries

여기서 특히 중요한 건 minute-based pricing이 있다는 점입니다. 실시간 음성 제품에서는 token보다 분 단가가 실제 운영 판단과 더 가깝습니다.

예를 들어 audio-only 10분 통화를 대충 계산하면:

  • 10분 입력 오디오\$0.005 / 분 이므로 약 $0.05
  • 10분 출력 오디오\$0.018 / 분 이므로 약 $0.18
  • 합계는 약 $0.23

이건 Google 문장을 그대로 옮긴 것이 아니라 공개된 minute-based 가격에서 바로 계산한 값입니다. 여기서 얻는 실무적 감각은 분명합니다. 무료 계약이 더 이상 맞지 않더라도, paid Flash Live는 작은 규모의 현실 검증에는 충분히 감당 가능한 편입니다.

  • 10분 통화 100회면 약 $23
  • 같은 통화 1,000회면 약 $230

물론 이게 전부는 아닙니다. text, search, video는 더 붙습니다. 그래도 free에서 paid로 넘어가는 순간 비용이 갑자기 비현실적으로 튀는 구조는 아닙니다.

오히려 더 조심할 것은 다음과 같습니다.

비디오는 “그냥 같이 보낸다”가 아니다.
Live docs는 default turn coverage가 all video frames 를 포함한다고 설명합니다. 제품의 핵심이 음성인데 카메라를 습관적으로 계속 보내면, 불필요한 비용과 복잡도를 스스로 늘리게 됩니다.

Search grounding은 공유 무료 풀 이후에는 별도 비용선이다.
현재는 Gemini 3 공유 월 5,000 free prompts가 있지만, 그 뒤는 \$14 / 1,000 queries 입니다. 검색을 자주 부르는 음성 어시스턴트라면 0원이라고 보면 안 됩니다.

세션 길이 자체가 runtime contract다.
현재 audio-only sessions는 15분, audio + video sessions는 2분이 기본 제한입니다. 더 길게 가려면 session-management가 필요합니다. 즉 무료 여부와 별개로, 구조가 바뀌는 순간이 이미 존재합니다.

무료 이후 Flash Live 비용 경계를 설명하는 이미지. 오디오 분단가, video 리스크, search 임계값을 요약한다

가장 안전한 시험 방법은 3단계면 충분하다

이 경로가 지금도 유효한지 확인하려고 거대한 구현을 먼저 할 필요는 없습니다.

1단계: pricing row를 확인한다.
pricing page 에서 Gemini 3.1 Flash Live Preview 구역을 직접 보고, model string이 gemini-3.1-flash-live-preview 인지, Free Tier가 여전히 Free of charge 인지 확인합니다.

2단계: AI Studio에서 실제 한도를 본다.
AI Studio rate-limit view 에서 실제로 쓸 project를 열어야 합니다. Google이 active limits의 답을 이제 거기에 두고 있기 때문입니다. billing state, account status, project가 바뀌면 live limit도 바뀔 수 있습니다.

3단계: 연결 경로는 안전한 쪽부터 고른다.
검증 단계라면 우선 server-side가 가장 단순합니다. 브라우저 직결이 필요해질 경우 Google이 마련한 안전한 경로는 ephemeral tokens 입니다. long-lived API key를 프론트에 두라는 뜻이 아닙니다. ephemeral-token 가이드의 핵심은 세 가지입니다.

  • 현재는 Live API 전용
  • client는 token을 API key처럼 사용
  • 기본적으로 1분 안에 새 세션 시작, 연결 후 30분 메시지 전송 가능

여기까지면 “Flash Live를 지금도 무료 API의 시작점으로 쓸 수 있는가”는 충분히 확인할 수 있습니다.

만약 이미 무료 여부보다 migration, 이벤트 처리, SDK 패턴, 브라우저 인증 세부가 더 중요하다면 Gemini 3.1 Flash Live API 가이드 로 바로 가는 편이 빠릅니다. 그 글이 구현 레이어를 담당합니다.

pricing 확인에서 AI Studio 한도 확인, 그리고 backend 또는 ephemeral token 브라우저 경로까지의 안전한 시험 흐름 이미지

언제 무료를 유지하고, 언제 유료로 넘어가며, 언제 다른 글을 봐야 하는가

이 주제를 이분법으로 보면 계속 틀리기 쉽습니다. 실제 질문은 “지금 내 작업에 어떤 계약이 맞는가” 이기 때문입니다.

다음 조건이 대체로 맞으면 무료 Flash Live 를 계속 써도 됩니다.

  • 아직 모델 적합성을 검증 중이다
  • 워크로드가 저위험이다
  • 내부 데모, 임시 프로토타입, 짧은 실험 범위다
  • unpaid services의 경계 조건을 감수할 수 있다
  • EEA / Switzerland / UK 사용자를 위한 공개 API client가 아니다

반대로 기술 경로는 아직 맞지만, 계약이 맞지 않기 시작하면 유료 Flash Live 로 넘어가야 합니다.

  • 더 강한 개인정보 보호 요건이 필요하다
  • billing에 기반한 운영 경로가 필요하다
  • 무료 검증 용량을 넘기기 시작한다
  • AI Studio의 현재 무료 한도를 장기 계약처럼 보지 않고, 더 현실적인 트래픽을 시험하고 싶다

그리고 질문 자체가 바뀌었다면 다른 글이 더 맞습니다.

이 마지막 분기가 중요합니다. 많은 사람들이 “무료 Flash Live API”를 찾는다고 생각하지만, 실제 문제는 “음성 모델을 싸게 검증하고 싶다”거나 “사실 다른 유료 경로가 더 맞는다”인 경우가 많습니다. Flash Live는 어디까지나 real-time, low-latency, voice-first 런타임입니다. 일이 그 형태가 아니라면, 무료라는 이유만으로 고르면 대체로 잘못된 출발이 됩니다.

무료 유지, 유료 전환, 더 넓은 가이드 또는 더 깊은 가이드로 이동할지 나누는 판단 이미지

FAQ

Gemini 3.1 Flash Live는 AI Studio에서만 무료고 API는 유료인가?

아닙니다. 2026년 3월 29일 기준 Google pricing page는 gemini-3.1-flash-live-preview 를 Gemini API에서도 Free of charge 로 표시합니다.

실제 limit는 어디서 확인하나?

AI Studio 입니다. Google의 현재 rate-limits 문서는 active limits를 거기서 보라고 안내하고, 공개된 limit가 보장값이 아니라고 적습니다.

무료 경로를 그대로 운영에 써도 되나?

그렇게 보면 안 됩니다. Flash Live는 여전히 preview 이고, preview terms는 preview services를 production use용으로 보지 않습니다. quota가 부족해지기 전에 계약이 먼저 틀어질 수 있습니다.

브라우저에서 직접 호출해도 되나?

가능하지만 안전한 방식은 backend에서 ephemeral token 을 발급하고 그걸로 Live API에 붙는 것입니다. long-lived API key를 브라우저에 두지 마세요.

아닙니다. paid pricing을 미리 봐야 실험이 실제 workflow가 될 때 어떤 비용 구조가 나오는지 이해할 수 있습니다. Flash Live는 minute-based pricing이 있어서 그 전환 비용이 비교적 읽기 쉽습니다.

실무적인 결론

Gemini 3.1 Flash Live는 오늘 기준으로도 Gemini API에서 실제로 무료 자격이 남아 있는 경로입니다. 그건 사실입니다. 하지만 더 정확한 답은 이렇습니다.

  • pricing page가 모델의 무료 자격을 알려준다
  • AI Studio가 project의 실제 사용 가능 용량 을 보여준다
  • terms가 그 무료 계약이 privacy, preview, 지역 배포 관점에서 맞는지 알려준다

그래서 올바른 조언은 “아직 무료니까 그냥 이걸로 간다”가 아닙니다. 올바른 조언은 다음입니다.

무료 Flash Live는 학습, 검증, 프로토타입용으로 쓰고, 생산 계약이 필요해지는 순간 유료 또는 다른 경로로 넘어간다.

Share:

laozhang.ai

One API, All AI Models

AI Image

Gemini 3 Pro Image

$0.05/img
80% OFF
AI Video

Sora 2 · Veo 3.1

$0.15/video
Async API
AI Chat

GPT · Claude · Gemini

200+ models
Official Price
Served 100K+ developers
|@laozhang_cn|Get $0.1