Gemini 图像 API 完整指南 2026：模型、价格、代码示例与中转方案

AI Free API Team

•2026年3月16日•22 分钟阅读•API 指南

2026 年 Gemini 图像 API 权威指南：覆盖从 Nano Banana 到 Imagen 4 的五款模型，提供 Python、Node.js 和 cURL 可运行代码示例，完整价格解析，免费额度限制说明，以及如何通过中转 API 实现低成本无限制访问。

2026 年，Gemini 图像 API 为开发者提供五款图像生成模型：Nano Banana（gemini-2.5-flash-image，起价 $0.039/张）、Nano Banana 2（gemini-3.1-flash-image-preview，2026 年 2 月 26 日发布，1K 分辨率起价 $0.045/张）、Nano Banana Pro（gemini-3-pro-image-preview，$0.134/张），以及 Imagen 4 三个档次，价格从 $0.02 到 $0.06 不等。Google AI Studio 为个人用户提供每日约 500 次请求的免费额度。对于所在地区无法直连 Google API 的开发者，或希望降低成本的用户，laozhang.ai 等中转服务提供完全兼容的 API 接口，且价格更低。本指南涵盖 2026 年将 Gemini 图像生成集成到应用所需的一切：模型选型、分步配置、三种语言的可用代码、完整价格及中转方案。

要点速览 — Gemini 图像 API 快速入门（2026）

如果您需要快速上手，以下是全部关键信息的汇总。Gemini 图像 API 分两大系列：原生 Gemini 模型（Nano Banana 系列），与现有 Gemini SDK 无缝衔接；以及 Imagen 4 系列，面向专业级输出，但无免费额度。

模型价格速查表(2026 年 3 月)

模型	API ID	价格/张	免费额度
Nano Banana	`gemini-2.5-flash-image`	$0.039	~500次/天
Nano Banana 批量	`gemini-2.5-flash-image`	$0.0195	无
Nano Banana 2（1K）	`gemini-3.1-flash-image-preview`	$0.045	~500次/天
Nano Banana 2（4K）	`gemini-3.1-flash-image-preview`	$0.151	无
Nano Banana Pro（1K/2K）	`gemini-3-pro-image-preview`	$0.134	无
Imagen 4 Fast	`imagen-4.0-fast-generate-001`	$0.02	无
Imagen 4 Standard	`imagen-4.0-generate-001`	$0.04	无
Imagen 4 Ultra	`imagen-4.0-ultra-generate-001`	$0.06	无

三行最简可用集成代码，使用 Nano Banana 2（截至 2026 年 3 月的最新模型）：

python
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-3.1-flash-image-preview")
response = model.generate_content("黄昏时分的未来城市天际线")
image_data = response.candidates[0].content.parts[0].inline_data.data
with open("output.png", "wb") as f:
    import base64; f.write(base64.b64decode(image_data))

在编写任何代码之前，您需要做的最重要决策是选择适合使用场景的模型。如果您有免费额度预算并希望使用最新功能，Nano Banana 2 是默认首选。如果您在生产环境中追求最低单张成本，Imagen 4 Fast 以 $0.02/张的价格无可匹敌。如果您所在的地区无法访问 Google API，中转 API 可以解决访问问题，且无需更改任何代码，只需替换 base URL 即可。

应该选择哪款 Gemini 图像模型？（选型指南）

Gemini 图像模型对比表，展示全部 6 款模型的价格、分辨率和适用场景

选错模型是开发者集成 Gemini 图像 API 时最常见、代价最高的错误之一。这五款模型不仅价格不同，在画质上限、可用分辨率、批量折扣资格和免费额度方面也有明显差异。提前了解这些差异，既能避免生产环境的高额账单，又能在开发阶段充分利用免费配额。

Nano Banana（gemini-2.5-flash-image）是经过验证的主力模型。发布于 2025 年初，其行为最为稳定，在生产环境中积累了最长时间的实际使用记录。标准价格为每张 $0.039，通过批量 API 可降至每张 $0.0195，但需接受 24 小时处理窗口。免费额度使其非常适合原型开发，而其输出质量在大多数商业场景下具有竞争力——产品效果图、社交媒体内容、博客配图和营销素材均可胜任。当您需要经过验证的稳定性、生态系统中最低的批量成本，或使用场景不要求最高分辨率时，选择 Nano Banana。

Nano Banana 2（gemini-3.1-flash-image-preview）是最新款，发布于 2026 年 2 月 26 日。这款模型将 4K 分辨率输出引入了 Gemini 原生图像生成阵容，对印刷生产和高保真显示场景意义重大。价格随分辨率显著提升：1K 为 $0.045/张，标准 1K 分辨率为 $0.067/张，4K 为 $0.151/张。除非您明确需要 4K 输出，否则 1K 档在提供比 Nano Banana Pro 更新模型训练的同时，性价比更高。免费额度适用于 1K 分辨率。关于该模型功能的详细技术解析，请参阅 Nano Banana 2（gemini-3.1-flash-image-preview）深度解析。

Nano Banana Pro（gemini-3-pro-image-preview）以 Gemini 原生系列的最高画质为目标。1K 和 2K 分辨率的价格为 $0.134/张，远高于同等分辨率下的 Nano Banana 和 Nano Banana 2。其适用场景相对窄但真实存在：创意机构制作主视觉图、高端电商摄影，或任何"好"与"卓越"之间的视觉质量差距会直接影响业务结果的场景。Nano Banana Pro 没有免费额度，也没有批量折扣。详细成本分析请参阅 Nano Banana Pro 定价详情。

Imagen 4 Fast（imagen-4.0-fast-generate-001）占据独特地位：整个生态系统中单张成本最低，仅 $0.02，但完全没有免费额度。这意味着从第一次 API 调用就需要付费，不适合开发阶段的实验，但对于已完成集成验证、需要高量级生产工作流的场景极具吸引力。Imagen 4 Fast 使用 Google 专用图像生成基础架构，而非 Gemini 多模态架构，这赋予其不同的质量特点——针对逼真照片级输出优化，推理速度更快。

Imagen 4 Standard 和 Ultra 完成了 Imagen 4 系列，分别定价为 $0.04 和 $0.06/张，为要求苛刻的专业应用提供逐步提升的画质。Imagen 4 Ultra 在照片级和艺术风格输出的质量指标上，与 Midjourney 和 DALL-E 3 同台竞技。

关于各模型系列的竞争对比，请参阅 Gemini 图像模型详细对比和 Gemini vs GPT-4o Image vs FLUX 对比。

选型决策简明版：在开发阶段，从 Nano Banana 或 Nano Banana 2 的免费额度开始。如果质量符合要求且希望追求最低单张成本，生产环境迁移至 Imagen 4 Fast。当输出画质是产品差异化核心时，使用实际提示词类型评估 Nano Banana Pro 或 Imagen 4 Standard/Ultra 的实际效果，而非单纯基于价格做决策。

Gemini 图像 API 配置教程：分步指南

Gemini 图像 API 配置流程：从 Google AI Studio 到保存首张生成图像的 4 个步骤

只要按照以下步骤精确执行，从零到完成可用集成大约需要十五分钟。最常见的配置失败原因有两个：混淆 Google AI Studio 密钥（适用于所有 Gemini 模型，包括图像生成）与其他 Google Cloud 凭证，以及安装了错误版本的 SDK。

第一步：从 Google AI Studio 获取 API 密钥

访问 Google AI Studio 并使用 Google 账号登录。免费额度访问无需配置账单——您可以立即生成 API 密钥并在速率限制内发起请求。点击左侧边栏的"获取 API 密钥"，如果没有现有的 Google Cloud 项目，选择"在新项目中创建 API 密钥"。立即复制密钥，因为 Google AI Studio 在初次生成后不会再次显示。将其存储在环境变量中：export GEMINI_API_KEY="your_key_here"。避免将 API 密钥硬编码到源代码中，尤其是将会提交到版本控制系统的应用程序。

第二步：安装 Gemini SDK

Python 官方 SDK 为 google-generativeai，通过以下命令安装：

bash
pip install google-generativeai>=0.8.0

最低版本要求很重要，因为图像生成支持是在 0.8.0 版本中添加的。更低的版本可以成功导入，但在运行时调用图像功能模型时会报错。Node.js：

bash
npm install @google/generative-ai

Node.js SDK 遵循相同的版本约束——确保运行 @google/generative-ai@0.21.0 或更高版本以获得完整的图像生成支持。

第三步：发起第一个 API 请求

在编写应用代码之前，先用最简单的请求验证密钥和 SDK 安装是否正常：

python
import google.generativeai as genai
import os

genai.configure(api_key=os.environ["GEMINI_API_KEY"])

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")
response = model.generate_content(
    "白色桌面上的一颗红苹果，照片级写实"
)


for part in response.candidates[0].content.parts:
    if hasattr(part, 'inline_data'):
        import base64
        image_bytes = base64.b64decode(part.inline_data.data)
        with open("test_output.png", "wb") as f:
            f.write(image_bytes)
        print("图像已保存至 test_output.png")

如果看到"图像已保存至 test_output.png"，说明配置正确。如果收到 403 PERMISSION_DENIED 错误，请仔细检查 API 密钥是否正确复制，以及模型 ID 是否完全匹配——模型 ID 区分大小写，Nano Banana 2 必须包含 preview 后缀。

第四步：正确处理响应结构

早期 Gemini 图像 API 集成中最常见的错误之一，是没有考虑到响应结构的特殊性。与文本生成中 response.text 直接返回完整输出不同，图像响应将生成的图像作为 inline_data 嵌入在 candidates[0].content.parts 内的 Part 对象中。图像经过 base64 编码，并通过 MIME 类型（image/png 或 image/jpeg）标识。始终遍历 parts 并检查 inline_data 属性，而非假设固定的索引位置，因为某些提示词可能在同一响应中同时产生文本和图像 parts。

所有 Gemini 图像模型的代码示例（Python、Node.js、cURL）

可以直接复制、粘贴并立即运行的代码，是 Gemini 图像 API 指南最有价值的内容。以下示例已针对 2026 年 3 月的 API 行为进行验证，涵盖两款最常用的模型：Nano Banana 2（因其时效性和免费额度支持）和 Imagen 4 Fast（因其生产成本效益）。

Python 示例

Nano Banana 2 — 带错误处理的标准生成：

python
import google.generativeai as genai
import base64
import os
from pathlib import Path

def generate_image_gemini(
    prompt: str,
    output_path: str = "output.png",
    model_id: str = "gemini-3.1-flash-image-preview"
) -> bool:
    """
    使用 Gemini 图像 API 生成图像。
    成功返回 True，失败返回 False。
    """
    genai.configure(api_key=os.environ["GEMINI_API_KEY"])
    model = genai.GenerativeModel(model_id)

    try:
        response = model.generate_content(prompt)

        for part in response.candidates[0].content.parts:
            if hasattr(part, 'inline_data') and part.inline_data.mime_type.startswith('image/'):
                image_bytes = base64.b64decode(part.inline_data.data)
                Path(output_path).write_bytes(image_bytes)
                print(f"图像已保存：{output_path}（{len(image_bytes)/1024:.1f} KB）")
                return True

        print(f"响应中无图像。文本内容：{response.text[:200]}")
        return False

    except Exception as e:
        print(f"生成失败：{e}")
        return False

# 使用示例
generate_image_gemini(
    prompt="科技初创公司的简约 Logo，几何图形，蓝白配色",
    output_path="logo.png"
)

Nano Banana — 批量 API 降低成本：

python
import google.generativeai as genai
import base64
import json
import os

def create_batch_image_job(prompts: list[str]) -> str:
    """
    以批量作业方式提交多个图像生成请求。
    批量作业在 24 小时内处理完成，价格为标准价的 50%。
    返回批量作业 ID。
    """
    genai.configure(api_key=os.environ["GEMINI_API_KEY"])

    requests = []
    for i, prompt in enumerate(prompts):
        requests.append({
            "custom_id": f"image_{i}",
            "method": "POST",
            "url": "/v1/models/gemini-2.5-flash-image:generateContent",
            "body": {
                "contents": [{"parts": [{"text": prompt}]}]
            }
        })

    # 将请求写入 JSONL 文件
    with open("batch_requests.jsonl", "w") as f:
        for req in requests:
            f.write(json.dumps(req) + "\n")

    # 上传并提交（需要 File API）
    client = genai.upload_file("batch_requests.jsonl")
    batch = genai.create_batch(input_file=client.uri)
    print(f"批量作业已创建：{batch.name}")
    return batch.name

# 100 张图像，每张 $0.0195 = 总计 $1.95（对比标准价 $3.90）
prompts = [f"产品照片变体 {i}：现代椅子，白色背景" for i in range(100)]
job_id = create_batch_image_job(prompts)

Node.js 示例

javascript
import { GoogleGenerativeAI } from "@google/generative-ai";
import { writeFileSync } from "fs";

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);

async function generateImage(prompt, outputPath = "output.png") {
  const model = genAI.getGenerativeModel({
    model: "gemini-3.1-flash-image-preview",
  });

  const result = await model.generateContent(prompt);
  const response = result.response;

  for (const part of response.candidates[0].content.parts) {
    if (part.inlineData && part.inlineData.mimeType.startsWith("image/")) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      writeFileSync(outputPath, imageBuffer);
      console.log(`图像已保存：${outputPath}（${imageBuffer.length / 1024} KB）`);
      return true;
    }
  }

  console.log("未生成图像。响应文本：", response.text());
  return false;
}

// 带并发控制的批量处理
async function generateImageBatch(prompts, concurrency = 3) {
  const results = [];
  for (let i = 0; i < prompts.length; i += concurrency) {
    const batch = prompts.slice(i, i + concurrency);
    const batchResults = await Promise.allSettled(
      batch.map((prompt, j) =>
        generateImage(prompt, `output_${i + j}.png`)
      )
    );
    results.push(...batchResults);
    if (i + concurrency < prompts.length) {
      await new Promise(resolve => setTimeout(resolve, 1000));
    }
  }
  return results;
}

await generateImage(
  "日出时分宁静的高山湖泊，照片级写实，8K 画质",
  "mountain_lake.png"
);

cURL 示例

对于测试和 Shell 脚本，cURL 提供了最直接的 API 访问方式：

bash
curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent?key=${GEMINI_API_KEY}" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{
        "text": "白色背景上简约木制台灯的产品照片"
      }]
    }],
    "generationConfig": {
      "responseModalities": ["IMAGE", "TEXT"]
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
for part in data['candidates'][0]['content']['parts']:
    if 'inlineData' in part:
        with open('output.png', 'wb') as f:
            f.write(base64.b64decode(part['inlineData']['data']))
        print('已保存 output.png')
"

通过 REST 使用 Imagen 4 Fast（端点结构不同）：

bash
curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-fast-generate-001:predict?key=${GEMINI_API_KEY}" \
  -H "Content-Type: application/json" \
  -d '{
    "instances": [{"prompt": "山路上一辆照片级写实的红色跑车"}],
    "parameters": {"sampleCount": 1}
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
img_data = data['predictions'][0]['bytesBase64Encoded']
with open('output.png', 'wb') as f:
    f.write(base64.b64decode(img_data))
print('已保存 output.png')
"

请注意，Imagen 4 使用不同的 API 端点格式（/predict 而非 /generateContent）和不同的响应结构。这是 Imagen 4 系列与 Gemini 原生图像模型之间的主要区别之一——它们共享同一个 API 密钥，但请求/响应结构各不相同。

Gemini 图像 API 价格：完整成本解析（2026 年 3 月）

柱状图对比 Gemini 各模型与 laozhang.ai 中转服务每千张图像费用，显示节省 63%

要真正理解 Gemini 图像生成的成本，不能只看单张价格的宣传数字，还需要了解分辨率、批量折扣和免费额度消耗如何影响您的实际月账单。以下价格信息来源于截至 2026 年 3 月的 Google AI 开发者定价文档。

标准定价完整表格

模型	分辨率	价格/张	批量价格	月成本（千张）
Nano Banana	标准	$0.039	$0.0195	$39 / $19.50
Nano Banana 2	1K	$0.045–$0.067	无	$45–$67
Nano Banana 2	4K	$0.151	无	$151
Nano Banana Pro	1K/2K	$0.134	无	$134
Nano Banana Pro	4K	$0.240	无	$240
Imagen 4 Fast	标准	$0.020	无	$20
Imagen 4 Standard	标准	$0.040	无	$40
Imagen 4 Ultra	标准	$0.060	无	$60

常见使用模式的真实成本场景：

对于构建 AI 设计工具的初创公司，每月为用户生成 10,000 张图像，成本区间为 $200（Imagen 4 Fast）到 $1,340（Nano Banana Pro 1K）。模型选择在这里带来了 6.7 倍的成本差异——从第一天就选对模型，比任何其他优化措施影响都要大。

对于构建作品集网站生成器的自由开发者，每月处理 500 张图像，免费额度几乎可以覆盖全部用量。Google AI Studio 免费额度允许每天约 500 次请求，即每月 15,000 次——远超此使用量。在开发和早期增长阶段，实际成本为 $0。

对于高量级社交媒体图像生成的内容机构，每月 100,000 张图像，Imagen 4 Fast 以 $0.02/张计算总额为 $2,000，而 Nano Banana 标准价则为 $3,900。Nano Banana 批量 API 以 $0.0195/张计算为 $1,950——与 Imagen 4 Fast 相近，但需接受 24 小时处理窗口。

批量 API 折扣值得特别关注。 Nano Banana 是目前唯一提供批量折扣的 Gemini 图像模型——通过批量 API 享受标准价的 5 折优惠。这对非实时工作流具有显著优势，如夜间内容生成、定时社交媒体发布和批量产品摄影。代价是批量作业保证在 24 小时内完成，但可能在提交后数小时才开始处理。在生产系统中，这通常意味着在夜间运行批量作业，到早上结果就已准备好。

国内开发者通常使用 laozhang.ai 等中转 API 来解决访问限制和降低成本问题。中转 API 代表您将请求转发给官方 Google API，同时提供兼容接口。关于 Nano Banana Pro 定价详情，包括中转定价与官方价格的对比，请参阅专门的定价指南。

免费额度详解：能免费生成多少张图像？

Gemini 图像 API 的免费额度有两种截然不同的形式，经常被混淆，理解差异对于决定是否需要从第一天就配置账单至关重要。

Google AI Studio(面向开发者的个人版)： 通过 aistudio.google.com 获取密钥访问的 Google AI Studio API，为 Nano Banana 和 Nano Banana 2 标准分辨率提供每天约 500 次请求的免费额度（Google AI Studio，2026 年 3 月）。这是与 API 集成应用的开发者相关的限制。免费额度按请求计数，而非严格按图像计数，每次请求根据配置可以生成多张图像。重要的是，免费额度对 Imagen 4 系列完全不适用——这些模型从第一次调用就需要付费。

Gemini App(消费产品)： Gemini 消费者应用（gemini.google.com 的聊天机器人）为图像生成功能提供单独的配额。截至 2025 年 12 月，Google 将 Gemini App 中免费（Basic）用户的图像生成配额降低至每天 20 张。此消费者配额与 API 配额完全独立，不影响使用 API 密钥的开发者。

Google AI Studio 免费额度请求的速率限制低于付费请求。典型的免费额度限制为每分钟 60 次请求（RPM）和每日 500 次请求上限。一旦为您的 Google Cloud 项目添加账单信息，速率限制将显著提升——大多数 Gemini 图像模型的标准付费档允许 1,000 RPM。有关完整速率限制信息，请参阅 Gemini API 完整速率限制指南和 Gemini 图像 API 免费访问指南。

对团队的实际影响： 免费额度按项目计算，而非按用户计算。如果您的团队有多名开发者，他们可以共享一个项目的免费额度，但一个为多名开发者提供服务的项目很快就会耗尽每日 500 次的限制。开发阶段的解决方法是为每名开发者创建独立的 Google Cloud 项目，每个项目都有自己的免费额度分配。

Nano Banana 2 4K 的免费额度： Nano Banana 2 的 4K 分辨率档没有等效的免费额度。只有 1K 分辨率图像才享有此模型的免费额度。这意味着即使在开发阶段测试 4K 生成也需要配置账单——如果 4K 分辨率是您的需求，请将此纳入预算规划。

Gemini 图像 API 中转：无限制访问与更低价格

访问限制对许多开发者来说是真实存在的问题。Gemini API 在有限的国家和地区官方可用，中国、部分东南亚市场和欧洲部分地区的开发者可能发现 API 调用返回访问拒绝错误，或在未完成的情况下超时。除地理限制外，一些组织的网络策略会阻止对 Google 基础设施的直接连接。

中转 API（也称为代理 API 或镜像 API）通过兼容的中间服务路由您的请求来解决这一问题。从您的应用程序角度来看，您将 base URL 指向中转服务而非 Google API 官方端点，中转服务将您的请求转发给 Google 的实际服务器并返回响应。关键要求是中转服务使用与官方 API 相同的请求和响应格式——一个好的中转服务只需替换 base URL，无需任何代码变更。

laozhang.ai 就是这样一个提供 Gemini 图像模型访问且格式兼容的中转服务。通过 laozhang.ai 中转获取 Nano Banana Pro 级别图像的价格约为每张 $0.05——相比官方 Nano Banana Pro 价格 $0.134/张便宜约 63%（2026 年 3 月）。这不仅对访问受限用户有吸引力，对任何优先考虑成本而非必须直接使用 Google 官方端点的开发者同样如此。

从官方 API 切换到中转服务，只需在现有 Python 代码中做一处修改：

python
import openai  # laozhang.ai 使用 OpenAI 兼容格式

client = openai.OpenAI(
    api_key="your_laozhang_api_key",
    base_url="https://api.laozhang.ai/v1"
)

response = client.images.generate(
    model="gemini-3-pro-image-preview",
    prompt="极简产品照片，白色背景",
    n=1,
    size="1024x1024"
)

image_url = response.data[0].url
print(f"生成的图像 URL：{image_url}")

中转服务使用 OpenAI Images API 格式而非 Gemini SDK 格式，意味着您需要使用 openai Python 库而非 google-generativeai。模型 ID 保持不变，便于在官方 API 和中转服务之间根据部署场景灵活切换。对于访问受限地区的开发者，中转服务实际上是在生产中使用这些模型的唯一途径。

评估中转服务的关键指标： 最重要的质量信号是 API 兼容性——中转服务应接受相同的模型 ID、返回相同的响应结构，并支持与官方 API 相同的参数。laozhang.ai 支持所有 Gemini 图像模型，包括 Nano Banana 2（2026 年 2 月发布）。API 文档可在 docs.laozhang.ai 查阅，您也可以在 images.laozhang.ai 进行交互式图像生成测试。

进阶用法：批量 API、错误处理与生产实践

从可用原型到生产级 Gemini 图像 API 集成，需要解决教程通常跳过的三个领域：用于降成本的批量 API、针对必然遇到的错误的健壮错误处理，以及在规模化场景下有效的系统设计模式。

批量 API 适用于 Nano Banana（gemini-2.5-flash-image），以异步处理换取 50% 的成本节省。架构为：上传包含请求的 JSONL 文件，提交批量作业，轮询完成状态，下载结果。对于延迟不是约束条件的高量级工作流——定时内容生成、夜间处理队列、批量产品摄影——批量 API 可以在不损失画质的前提下将图像生成成本减半。

错误处理在生产环境中不可或缺。 Gemini 图像 API 中最常遇到的三种错误是 429（超出速率限制）、400（内容策略违规）和 503（服务暂时不可用）。每种错误需要不同的响应策略：

python
import time
import google.generativeai as genai
from google.api_core import exceptions as google_exceptions

def generate_image_with_retry(prompt: str, max_retries: int = 3) -> bytes | None:
    model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            for part in response.candidates[0].content.parts:
                if hasattr(part, 'inline_data'):
                    import base64
                    return base64.b64decode(part.inline_data.data)
            return None

        except google_exceptions.ResourceExhausted as e:
            if attempt < max_retries - 1:
                wait_time = (2 ** attempt) * 5
                print(f"触发速率限制。等待 {wait_time} 秒后重试（{attempt + 2}/{max_retries}）")
                time.sleep(wait_time)
            else:
                raise

        except google_exceptions.InvalidArgument as e:
            print(f"内容策略违规：{e}")
            return None

        except google_exceptions.ServiceUnavailable as e:
            if attempt < max_retries - 1:
                time.sleep(30)
            else:
                raise

    return None

针对 429 速率限制错误的详细解决方案，请参阅 Gemini 429 速率限制错误解决方案。

内容策略行为在 Gemini 图像 API 中比某些竞品模型更为严格。API 会拒绝在特定情境下涉及真实人脸、露骨内容以及某些政治或敏感话题的提示词。拒绝通常返回 400 错误，并附带说明内容策略违规的消息。在生产系统中，应在调用 API 前实施提示词验证，维护已知问题提示词模式列表，并在用户界面中优雅地处理和解释策略拒绝，而非直接显示原始错误信息。

生产环境的速率限制规划： 免费额度限制（60 RPM、500 RPD）对于开发和低流量应用已足够。付费额度限制因模型和账单档次而异。对于预期流量较大的应用，在上线前使用 Gemini API 完整速率限制指南规划架构。并发控制——限制同时进行中的 API 请求数量——比重试逻辑更能有效预防速率限制错误。

图像质量的提示词工程： Gemini 图像模型对明确指定主体、风格、光线和构图的结构化提示词响应良好。"一张产品照片"会产生平庸的结果。"一款陶瓷咖啡马克杯的写实产品照片，来自左侧的柔和自然光，白色背景，清晰对焦，商业摄影风格，4K 细节"能产出符合专业使用要求的效果。针对您的使用场景维护一套经过验证的提示词模板库，并将其与代码一起进行版本控制。

常见问题解答

Gemini 图像 API 免费吗？

Gemini 图像 API 通过 Google AI Studio 为 Nano Banana 和 Nano Banana 2 标准分辨率提供每天约 500 次请求的免费额度。Imagen 4 系列（Fast、Standard、Ultra）没有免费额度，从第一次请求就需要付费。免费额度不包括 Nano Banana 2 4K 分辨率或 Nano Banana Pro。对于个人开发者和小型项目，免费额度足以在零成本的情况下构建和测试完整集成。

Nano Banana 和 Imagen 4 有什么区别？

Nano Banana 模型是 Google 原生的 Gemini 多模态图像生成模型。它们有免费额度，支持标准 Gemini SDK，可以作为多轮对话的一部分生成图像。Imagen 4 模型是 Google 专用的专业图像生成基础架构——无免费额度，API 端点格式不同，但在照片级输出质量上可能更高。

我可以在中国使用 Gemini 图像 API 吗？

官方 Gemini API 在有限的国家可用。所在地区受限的开发者——包括中国和其他一些市场——可以使用 laozhang.ai 等中转 API，通过中间服务器提供兼容的 API 访问。中转服务只需修改配置中的 base URL，提供完全相同的功能，且专业级模型的单张价格可能低于官方定价。

如何降低 Gemini 图像 API 的费用？

最有效的降成本策略：（1）为 Nano Banana 使用批量 API——24 小时处理窗口换 5 折优惠。（2）在生产环境中使用 Imagen 4 Fast（$0.02/张），前提是画质满足要求。（3）在开发阶段最大化利用免费额度——每天 500 次请求对测试来说相当充裕。（4）考虑使用 laozhang.ai 等中转 API 获取专业级图像，成本约比官方 Nano Banana Pro 价格低 63%。

Gemini 图像 API 返回什么格式的图像？

Gemini 原生模型默认以 base64 编码数据形式返回图像，MIME 类型为 image/png。分辨率和格式控制因模型而异——Nano Banana 2 支持明确的分辨率选择（1K 或 4K）。如果您需要 JPEG 或 WebP 等特定格式，可以在收到响应后使用 Pillow 等库将 PNG 输出进行转换。

Gemini 2.0 Flash Image 和 Gemini 3.0 Flash 发生了什么变化？

模型名称已经演变。gemini-2.0-flash-image 是早期版本，已被 gemini-2.5-flash-image（Nano Banana）取代。gemini-3-pro-image-preview（Nano Banana Pro）不应与已停用的 gemini-3.0-pro 文本模型混淆，后者已于 2026 年 3 月 9 日退役。

结语：选择您的前进路径

2026 年的 Gemini 图像 API 在五款各具特色的模型之间提供了真实的取舍空间。对于大多数开发者启动新项目而言，Nano Banana 2（gemini-3.1-flash-image-preview）是默认最佳起点：它是 Gemini 原生系列中最新的模型，有开发阶段的免费额度支持，在保持 1K 分辨率合理成本的同时，质量优于原始 Nano Banana。

随着项目成熟，生产模型的选择应由实际画质需求和用量驱动。对于 Imagen 4 Fast 画质已足够的高量级应用，$0.02/张的价格难以被超越。对于图像质量是核心产品差异化因素的应用，应针对具体提示词类型评估 Nano Banana Pro 和 Imagen 4 Standard 或 Ultra 的实际输出质量，而非仅基于价格做决策。

面临地理访问限制的开发者，可以通过中转 API 找到切实可行的解决路径——集成改动极小，API 兼容性完整，专业级模型的单张成本甚至可以低于官方定价。这使中转 API 成为真正可行的生产方案，而非仅仅是变通之策。

2026 年，Gemini 图像 API 为开发者提供五款图像生成模型：Nano Banana（gemini-2.5-flash-image，起价 $0.039/张）、Nano Banana 2（gemini-3.1-flash-image-preview，2026 年 2 月 26 日发布，1K 分辨率起价 $0.045/张）、Nano Banana Pro（gemini-3-pro-image-preview，$0.134/张），以及 Imagen 4 三个档次，价格从 $0.02 到 $0.06 不等。Google AI Studio 为个人用户提供每日约 500 次请求的免费额度。对于所在地区无法直连 Google API 的开发者，或希望降低成本的用户，laozhang.ai 等中转服务提供完全兼容的 API 接口，且价格更低。本指南涵盖 2026 年将 Gemini 图像生成集成到应用所需的一切：模型选型、分步配置、三种语言的可用代码、完整价格及中转方案。

要点速览 — Gemini 图像 API 快速入门（2026）

模型价格速查表（2026 年 3 月）

三行最简可用集成代码，使用 Nano Banana 2（截至 2026 年 3 月的最新模型）：

应该选择哪款 Gemini 图像模型？（选型指南）

Nano Banana（gemini-2.5-flash-image）是经过验证的主力模型。发布于 2025 年初，其行为最为稳定，在生产环境中积累了最长时间的实际使用记录。标准价格为每张 $0.039，通过批量 API 可降至每张 $0.0195，但需接受 24 小时处理窗口。免费额度使其非常适合原型开发，而其输出质量在大多数商业场景下具有竞争力——产品效果图、社交媒体内容、博客配图和营销素材均可胜任。当您需要经过验证的稳定性、生态系统中最低的批量成本，或使用场景不要求最高分辨率时，选择 Nano Banana。

Nano Banana 2（gemini-3.1-flash-image-preview）是最新款，发布于 2026 年 2 月 26 日。这款模型将 4K 分辨率输出引入了 Gemini 原生图像生成阵容，对印刷生产和高保真显示场景意义重大。价格随分辨率显著提升：1K 为 $0.045/张，标准 1K 分辨率为 $0.067/张，4K 为 $0.151/张。除非您明确需要 4K 输出，否则 1K 档在提供比 Nano Banana Pro 更新模型训练的同时，性价比更高。免费额度适用于 1K 分辨率。关于该模型功能的详细技术解析，请参阅 Nano Banana 2（gemini-3.1-flash-image-preview）深度解析。

Nano Banana Pro（gemini-3-pro-image-preview）以 Gemini 原生系列的最高画质为目标。1K 和 2K 分辨率的价格为 $0.134/张，远高于同等分辨率下的 Nano Banana 和 Nano Banana 2。其适用场景相对窄但真实存在：创意机构制作主视觉图、高端电商摄影，或任何"好"与"卓越"之间的视觉质量差距会直接影响业务结果的场景。Nano Banana Pro 没有免费额度，也没有批量折扣。详细成本分析请参阅 Nano Banana Pro 定价详情。

Imagen 4 Fast（imagen-4.0-fast-generate-001）占据独特地位：整个生态系统中单张成本最低，仅 $0.02，但完全没有免费额度。这意味着从第一次 API 调用就需要付费，不适合开发阶段的实验，但对于已完成集成验证、需要高量级生产工作流的场景极具吸引力。Imagen 4 Fast 使用 Google 专用图像生成基础架构，而非 Gemini 多模态架构，这赋予其不同的质量特点——针对逼真照片级输出优化，推理速度更快。

Imagen 4 Standard 和 Ultra 完成了 Imagen 4 系列，分别定价为 $0.04 和 $0.06/张，为要求苛刻的专业应用提供逐步提升的画质。Imagen 4 Ultra 在照片级和艺术风格输出的质量指标上，与 Midjourney 和 DALL-E 3 同台竞技。

关于各模型系列的竞争对比，请参阅 Gemini 图像模型详细对比和 Gemini vs GPT-4o Image vs FLUX 对比。

选型决策简明版：在开发阶段，从 Nano Banana 或 Nano Banana 2 的免费额度开始。如果质量符合要求且希望追求最低单张成本，生产环境迁移至 Imagen 4 Fast。当输出画质是产品差异化核心时，使用实际提示词类型评估 Nano Banana Pro 或 Imagen 4 Standard/Ultra 的实际效果，而非单纯基于价格做决策。

Gemini 图像 API 配置教程：分步指南

第一步：从 Google AI Studio 获取 API 密钥

访问 Google AI Studio 并使用 Google 账号登录。免费额度访问无需配置账单——您可以立即生成 API 密钥并在速率限制内发起请求。点击左侧边栏的"获取 API 密钥"，如果没有现有的 Google Cloud 项目，选择"在新项目中创建 API 密钥"。立即复制密钥，因为 Google AI Studio 在初次生成后不会再次显示。将其存储在环境变量中：export GEMINI_API_KEY="your_key_here"。避免将 API 密钥硬编码到源代码中，尤其是将会提交到版本控制系统的应用程序。

第二步：安装 Gemini SDK

Python 官方 SDK 为 google-generativeai，通过以下命令安装：

最低版本要求很重要，因为图像生成支持是在 0.8.0 版本中添加的。更低的版本可以成功导入，但在运行时调用图像功能模型时会报错。Node.js：

Node.js SDK 遵循相同的版本约束——确保运行 @google/generative-ai@0.21.0 或更高版本以获得完整的图像生成支持。

第三步：发起第一个 API 请求

在编写应用代码之前，先用最简单的请求验证密钥和 SDK 安装是否正常：

如果看到"图像已保存至 test_output.png"，说明配置正确。如果收到 403 PERMISSION_DENIED 错误，请仔细检查 API 密钥是否正确复制，以及模型 ID 是否完全匹配——模型 ID 区分大小写，Nano Banana 2 必须包含 preview 后缀。

第四步：正确处理响应结构

早期 Gemini 图像 API 集成中最常见的错误之一，是没有考虑到响应结构的特殊性。与文本生成中 response.text 直接返回完整输出不同，图像响应将生成的图像作为 inline_data 嵌入在 candidates[0].content.parts 内的 Part 对象中。图像经过 base64 编码，并通过 MIME 类型（image/png 或 image/jpeg）标识。始终遍历 parts 并检查 inline_data 属性，而非假设固定的索引位置，因为某些提示词可能在同一响应中同时产生文本和图像 parts。

所有 Gemini 图像模型的代码示例（Python、Node.js、cURL）

Python 示例

Nano Banana 2 — 带错误处理的标准生成：

Nano Banana — 批量 API 降低成本：

Node.js 示例

cURL 示例

对于测试和 Shell 脚本，cURL 提供了最直接的 API 访问方式：

通过 REST 使用 Imagen 4 Fast（端点结构不同）：

请注意，Imagen 4 使用不同的 API 端点格式（/predict 而非 /generateContent）和不同的响应结构。这是 Imagen 4 系列与 Gemini 原生图像模型之间的主要区别之一——它们共享同一个 API 密钥，但请求/响应结构各不相同。

Gemini 图像 API 价格：完整成本解析（2026 年 3 月）

标准定价完整表格

常见使用模式的真实成本场景：

对于构建 AI 设计工具的初创公司，每月为用户生成 10,000 张图像，成本区间为 $200（Imagen 4 Fast）到 $1,340（Nano Banana Pro 1K）。模型选择在这里带来了 6.7 倍的成本差异——从第一天就选对模型，比任何其他优化措施影响都要大。

对于构建作品集网站生成器的自由开发者，每月处理 500 张图像，免费额度几乎可以覆盖全部用量。Google AI Studio 免费额度允许每天约 500 次请求，即每月 15,000 次——远超此使用量。在开发和早期增长阶段，实际成本为 $0。

对于高量级社交媒体图像生成的内容机构，每月 100,000 张图像，Imagen 4 Fast 以 $0.02/张计算总额为 $2,000，而 Nano Banana 标准价则为 $3,900。Nano Banana 批量 API 以 $0.0195/张计算为 $1,950——与 Imagen 4 Fast 相近，但需接受 24 小时处理窗口。

批量 API 折扣值得特别关注。 Nano Banana 是目前唯一提供批量折扣的 Gemini 图像模型——通过批量 API 享受标准价的 5 折优惠。这对非实时工作流具有显著优势，如夜间内容生成、定时社交媒体发布和批量产品摄影。代价是批量作业保证在 24 小时内完成，但可能在提交后数小时才开始处理。在生产系统中，这通常意味着在夜间运行批量作业，到早上结果就已准备好。

免费额度详解：能免费生成多少张图像？

Gemini 图像 API 的免费额度有两种截然不同的形式，经常被混淆，理解差异对于决定是否需要从第一天就配置账单至关重要。

Google AI Studio（面向开发者的个人版）：通过 aistudio.google.com 获取密钥访问的 Google AI Studio API，为 Nano Banana 和 Nano Banana 2 标准分辨率提供每天约 500 次请求的免费额度（Google AI Studio，2026 年 3 月）。这是与 API 集成应用的开发者相关的限制。免费额度按请求计数，而非严格按图像计数，每次请求根据配置可以生成多张图像。重要的是，免费额度对 Imagen 4 系列完全不适用——这些模型从第一次调用就需要付费。

Gemini App（消费产品）： Gemini 消费者应用（gemini.google.com 的聊天机器人）为图像生成功能提供单独的配额。截至 2025 年 12 月，Google 将 Gemini App 中免费（Basic）用户的图像生成配额降低至每天 20 张。此消费者配额与 API 配额完全独立，不影响使用 API 密钥的开发者。

对团队的实际影响：免费额度按项目计算，而非按用户计算。如果您的团队有多名开发者，他们可以共享一个项目的免费额度，但一个为多名开发者提供服务的项目很快就会耗尽每日 500 次的限制。开发阶段的解决方法是为每名开发者创建独立的 Google Cloud 项目，每个项目都有自己的免费额度分配。

Nano Banana 2 4K 的免费额度： Nano Banana 2 的 4K 分辨率档没有等效的免费额度。只有 1K 分辨率图像才享有此模型的免费额度。这意味着即使在开发阶段测试 4K 生成也需要配置账单——如果 4K 分辨率是您的需求，请将此纳入预算规划。

Gemini 图像 API 中转：无限制访问与更低价格

laozhang.ai 就是这样一个提供 Gemini 图像模型访问且格式兼容的中转服务。通过 laozhang.ai 中转获取 Nano Banana Pro 级别图像的价格约为每张 $0.05——相比官方 Nano Banana Pro 价格 $0.134/张便宜约 63%（2026 年 3 月）。这不仅对访问受限用户有吸引力，对任何优先考虑成本而非必须直接使用 Google 官方端点的开发者同样如此。

从官方 API 切换到中转服务，只需在现有 Python 代码中做一处修改：

中转服务使用 OpenAI Images API 格式而非 Gemini SDK 格式，意味着您需要使用 openai Python 库而非 google-generativeai。模型 ID 保持不变，便于在官方 API 和中转服务之间根据部署场景灵活切换。对于访问受限地区的开发者，中转服务实际上是在生产中使用这些模型的唯一途径。

评估中转服务的关键指标：最重要的质量信号是 API 兼容性——中转服务应接受相同的模型 ID、返回相同的响应结构，并支持与官方 API 相同的参数。laozhang.ai 支持所有 Gemini 图像模型，包括 Nano Banana 2（2026 年 2 月发布）。API 文档可在 docs.laozhang.ai 查阅，您也可以在 images.laozhang.ai 进行交互式图像生成测试。

进阶用法：批量 API、错误处理与生产实践

批量 API 适用于 Nano Banana（gemini-2.5-flash-image），以异步处理换取 50% 的成本节省。架构为：上传包含请求的 JSONL 文件，提交批量作业，轮询完成状态，下载结果。对于延迟不是约束条件的高量级工作流——定时内容生成、夜间处理队列、批量产品摄影——批量 API 可以在不损失画质的前提下将图像生成成本减半。

错误处理在生产环境中不可或缺。 Gemini 图像 API 中最常遇到的三种错误是 429（超出速率限制）、400（内容策略违规）和 503（服务暂时不可用）。每种错误需要不同的响应策略：

针对 429 速率限制错误的详细解决方案，请参阅 Gemini 429 速率限制错误解决方案。

内容策略行为在 Gemini 图像 API 中比某些竞品模型更为严格。API 会拒绝在特定情境下涉及真实人脸、露骨内容以及某些政治或敏感话题的提示词。拒绝通常返回 400 错误，并附带说明内容策略违规的消息。在生产系统中，应在调用 API 前实施提示词验证，维护已知问题提示词模式列表，并在用户界面中优雅地处理和解释策略拒绝，而非直接显示原始错误信息。

生产环境的速率限制规划：免费额度限制（60 RPM、500 RPD）对于开发和低流量应用已足够。付费额度限制因模型和账单档次而异。对于预期流量较大的应用，在上线前使用 Gemini API 完整速率限制指南规划架构。并发控制——限制同时进行中的 API 请求数量——比重试逻辑更能有效预防速率限制错误。

图像质量的提示词工程： Gemini 图像模型对明确指定主体、风格、光线和构图的结构化提示词响应良好。"一张产品照片"会产生平庸的结果。"一款陶瓷咖啡马克杯的写实产品照片，来自左侧的柔和自然光，白色背景，清晰对焦，商业摄影风格，4K 细节"能产出符合专业使用要求的效果。针对您的使用场景维护一套经过验证的提示词模板库，并将其与代码一起进行版本控制。

常见问题解答

Gemini 图像 API 免费吗？

Nano Banana 和 Imagen 4 有什么区别？

我可以在中国使用 Gemini 图像 API 吗？

如何降低 Gemini 图像 API 的费用？

Gemini 图像 API 返回什么格式的图像？

Gemini 原生模型默认以 base64 编码数据形式返回图像，MIME 类型为 image/png。分辨率和格式控制因模型而异——Nano Banana 2 支持明确的分辨率选择（1K 或 4K）。如果您需要 JPEG 或 WebP 等特定格式，可以在收到响应后使用 Pillow 等库将 PNG 输出进行转换。

Gemini 2.0 Flash Image 和 Gemini 3.0 Flash 发生了什么变化？

模型名称已经演变。gemini-2.0-flash-image 是早期版本，已被 gemini-2.5-flash-image（Nano Banana）取代。gemini-3-pro-image-preview（Nano Banana Pro）不应与已停用的 gemini-3.0-pro 文本模型混淆，后者已于 2026 年 3 月 9 日退役。

结语：选择您的前进路径

2026 年的 Gemini 图像 API 在五款各具特色的模型之间提供了真实的取舍空间。对于大多数开发者启动新项目而言，Nano Banana 2（gemini-3.1-flash-image-preview）是默认最佳起点：它是 Gemini 原生系列中最新的模型，有开发阶段的免费额度支持，在保持 1K 分辨率合理成本的同时，质量优于原始 Nano Banana。

#Gemini API #图像生成 #Google AI #API 价格 #中转 API

分享文章:

laozhang.ai

一个 API，所有 AI 模型

文档

AI 图片

Gemini 3 Pro Image

$0.05/张

官方2折

AI 视频

Sora 2 · Veo 3.1

$0.15/个

异步API

AI 对话

GPT · Claude · Gemini

200+ 模型

同官方价

已服务 10万+ 开发者·失败不扣费·企业级稳定·支付宝/TG支付

|@laozhang_cn|送$0.1