跳转到主要内容

Gemini 3.1 Flash Image Preview ComfyUI 集成教程:完整设置指南(2026)

A
26 分钟阅读AI 图像生成

将 gemini-3.1-flash-image-preview 与 ComfyUI 集成的完整指南。本文对比全部 5 个节点,手把手教你设置 API 密钥和计费配置,提供 3 个即用工作流,并展示如何将每张图片成本从 $0.151 降至 $0.05。

Gemini 3.1 Flash Image Preview ComfyUI 集成教程:完整设置指南(2026)

Gemini 3.1 Flash Image Preview 通过 ComfyUI_Nano_Banana 和 ComfyUI-NanoBanano 等自定义节点与 ComfyUI 实现集成。设置过程需要一个付费的 Google AI API 密钥(每张 1024px 图片 $0.067),安装仅需不到 5 分钟即可通过 git clone 完成。该模型支持 512px 到 4096px 的分辨率范围,可在 ComfyUI 工作流中直接进行文生图、图片编辑和风格迁移。本指南涵盖从选择正确节点到优化成本的每一个步骤。

Gemini 3.1 Flash Image Preview 是什么,为什么要在 ComfyUI 中使用它

Google 于 2026 年 2 月 26 日发布了 gemini-3.1-flash-image-preview,将其定位为更大型 Gemini 3 Pro Image 模型的快速、经济替代方案。与需要强大 GPU 的本地 Stable Diffusion 模型不同,Gemini 3.1 Flash Image 完全运行在 Google 云端,并通过 API 调用返回结果。这意味着你可以在任何能运行 ComfyUI 的设备上生成高质量 AI 图像,即使是没有独立 GPU 的笔记本电脑也不例外。该模型接受文本提示词和参考图片,输出分辨率从 512px 到 4096px,支持从 1:1 到 8:1 的宽高比,足以胜任社交媒体图形、产品样机和创意插画等多种用途。

对于已经使用 Stable Diffusion 或 SDXL 建立工作流的 ComfyUI 用户来说,添加 Gemini 3.1 Flash Image 能够创建强大的混合流水线。你可以使用本地模型进行零成本的快速原型设计,然后切换到 Gemini 来生成最终输出,充分利用其卓越的文字渲染精度(根据 SpectrumAILab 基准测试为 94-96%)以及处理复杂多物体场景的能力。这里的范式转换非常重要:不再需要下载 6GB 的模型检查点并等待加载到显存中,你只需发送一个 API 请求,就能在 3-5 秒内收到完成的图像。这种权衡是每张图片的成本与硬件投资之间的取舍,对于许多创作者来说,特别是偶发性或突发性工作负载,云端生成在经济上更具优势。如果你想更深入了解 Gemini 3.1 Flash Image 与 Pro 模型的对比,请查看我们的 Gemini 3.1 Flash Image Preview 完整概述Nano Banana Pro 与 Nano Banana 2 对比

ComfyUI 中 Gemini 图像生成节点对比

ComfyUI Gemini 节点对比图表,展示 5 个节点的功能差异

选择正确的 ComfyUI Gemini 图像生成节点是整个设置过程中最重要的决定,也是大多数用户浪费时间最多的环节。截至 2026 年 3 月,至少有五个社区构建的自定义节点可以将 ComfyUI 连接到 Google 的 Gemini 图像模型。每个节点由不同的开发者创建,优先级各不相同,它们之间的功能差距非常显著。安装了错误的节点意味着你会错过批处理、多参考图支持或 4K 分辨率输出等关键功能,而且你可能要到深入工作流构建时才会发现这些限制。

下表从生产使用最重要的维度对比了所有五个节点。我们通过检查每个节点的 GitHub 仓库、测试安装流程并验证其功能声明与实际代码库的一致性来评估每个节点。关键区别在于模型支持的广度、分辨率范围、参考图处理能力以及输出管线的稳定性。

ComfyUI_Nano_Banana(ru4ls 开发) 在 gemini-3.1-flash-image-preview 集成方面是明显的赢家。它是唯一支持完整 0.5K 到 4K 分辨率范围、允许单次生成调用中使用多达 14 张参考图、包含专用批处理节点、并提供种子控制以实现可复现输出的节点。该节点专门为 Nano Banana 2 模型设计,并由活跃的维护者定期更新。安装过程通过 git clone 即可完成,并且可以与 ComfyUI Manager 顺畅集成实现一键更新。

ComfyUI-NanoBanano(ShmuelRonen 开发) 是第二佳选择,也是最早的 ComfyUI Gemini 图像节点之一。它支持 3.1 Flash 和 3 Pro 两种模型,包含图像编辑功能,并提供种子控制。然而,其分辨率范围仅限于 1K-2K,批处理支持也只是部分实现。如果你主要在标准分辨率下工作且不需要 14 张参考图的工作流,它仍然是一个不错的选择。其余三个节点——ComfyUI-Gemini、ComfyUI-NanoB-Edit-Gemini 和 ComfyUI-JM-Gemini-API——每个都覆盖了基本的文生图功能,但缺少使 ComfyUI_Nano_Banana 成为推荐选择的高级特性。只有当你有非常特定的需求与它们有限的功能集相匹配时(例如需要最小化安装体积或偏好某个开发者的 UI 风格),才值得考虑这些节点。

分步安装指南

安装 ComfyUI_Nano_Banana 只需要三条命令,在任何操作系统上都能在五分钟内完成。在开始之前,请确保你有一个正常运行的 ComfyUI 安装,Python 版本为 3.10 或更高,并且终端中可以使用 git。如果你在 Windows 上通过便携安装运行 ComfyUI,请打开随附的嵌入式终端而不是系统终端,这样可以确保使用正确的 Python 环境。

通过 Git Clone 安装

最可靠的安装方式是将仓库直接克隆到 ComfyUI 的自定义节点目录中。打开终端,导航到 ComfyUI 安装目录中的 custom_nodes 文件夹,然后运行以下命令。这种方法在 Windows、macOS 和 Linux 上完全一致,唯一的区别是 ComfyUI 的安装路径。

bash
cd /path/to/ComfyUI/custom_nodes git clone https://github.com/ru4ls/ComfyUI_Nano_Banana.git pip install -r ComfyUI_Nano_Banana/requirements.txt

安装完成后,需要完全重启 ComfyUI。仅刷新页面是不够的,因为自定义节点是在服务器启动过程中加载的。当 ComfyUI 成功重启后,你应该能在启动日志中看到 "ComfyUI_Nano_Banana" 且没有任何错误信息。如果遇到导入错误,最常见的原因是 Python 版本不匹配,运行 python --version 可以确认你是否满足 3.10+ 的要求。

通过 ComfyUI Manager 安装

如果你已经安装了 ComfyUI Manager,可以完全跳过终端操作,通过图形界面安装节点。从侧栏打开 ComfyUI Manager,点击 "Install Custom Nodes",搜索 "Nano Banana",然后点击 ComfyUI_Nano_Banana(ru4ls)旁边的安装按钮。Manager 会自动处理 git 克隆和依赖安装。安装完成后,在 ComfyUI Manager 中点击 "Restart" 来重新加载所有自定义节点。这种方法特别适合管理大量自定义节点的用户,因为 ComfyUI Manager 会在有新版本可用时通知你更新。

验证安装

要在配置 API 密钥之前确认节点正常工作,在 ComfyUI 画布上右键单击,从上下文菜单中选择 "Add Node"。在搜索栏中搜索 "NanoBanana" 或 "Gemini"。你应该能看到几个新节点出现,包括 NanoBanana2_Generate、NanoBanana2_Edit 和 NanoBanana2_BatchGenerate。如果这些节点没有出现,请检查 ComfyUI 服务器终端中的错误信息。最常见的安装问题是缺少依赖项,你可以在 ComfyUI_Nano_Banana 目录内再次运行 pip install -r requirements.txt 来解决。

API 密钥设置与计费配置

API 密钥设置与计费配置分步流程图

获取 API 密钥本身很简单,但有一个关键陷阱几乎会绊倒每一个新用户:Google AI Studio 的免费版不支持图片生成。这一点在注册流程中并不明显,许多用户花了数小时排查 "permission denied" 错误后才发现需要启用计费。免费版对于纯文本 Gemini 请求运行得很好,但任何对 gemini-3.1-flash-image-preview 的图片输出调用都会返回 403 错误,除非你的 Google Cloud 项目已经关联了一个有效的计费账户。在开始之前理解这个区别将为你节省大量挫折。

创建 API 密钥

访问 Google AI Studio(aistudio.google.com),使用你的 Google 账号登录。如果你还没有 Google Cloud 项目,平台会自动为你创建一个。点击左侧栏的 "Get API Key",然后选择 "Create API Key in new project" 或选择一个已有项目。立即复制生成的密钥并安全保存。离开页面后你将无法再次查看完整密钥,但如果需要可以随时生成新密钥。关于密钥生成过程的更详细指南(包括截图和常见账户问题的排查),请参阅我们的获取 Google AI API 密钥指南

启用计费(图片生成必需)

这是大多数教程跳过的步骤,也是图片生成最重要的配置步骤。前往 Google Cloud Console(console.cloud.google.com),从顶部下拉菜单中选择你的项目,然后在左侧栏中导航到 "Billing"。点击 "Link a billing account" 并添加信用卡等支付方式。Google 在此设置过程中不会向你收取任何费用,你还可以设置预算提醒来控制支出。计费激活后,你的 API 密钥就获得了调用图片生成端点的权限。更改通常在几分钟内生效,但偶尔可能需要最多一小时才能在所有 Google 服务中传播。

在 ComfyUI 中配置密钥

你有两种方式为 ComfyUI_Nano_Banana 节点提供 API 密钥。最简单的方法是将密钥直接粘贴到 ComfyUI 画布上节点的 API 密钥字段中。这种方法立即生效,但意味着你的密钥以明文形式可见,如果导出工作流,密钥会保存在 JSON 文件中。更安全的方法是在启动 ComfyUI 之前设置名为 GOOGLE_API_KEY 的环境变量。在 Linux 和 macOS 上,将 export GOOGLE_API_KEY="your-key-here" 添加到你的 shell 配置文件(~/.bashrc 或 ~/.zshrc)中。在 Windows 上,通过系统属性设置,或在启动 ComfyUI 之前在 PowerShell 中运行 $env:GOOGLE_API_KEY="your-key-here"。设置环境变量后,节点会自动检测到它,你无需在画布上的 API 密钥字段中输入任何内容。

如果你遇到持续的计费或 API 访问问题,或者你所在地区无法使用 Google Cloud 计费,laozhang.ai 提供了一个 OpenAI 兼容的 API 端点,路由到相同的 gemini-3.1-flash-image-preview 模型,无需设置 Google Cloud 计费。对于需要快速开始生成图片同时解决 Google 计费配置问题的用户来说,这是一个实用的替代方案。

构建三个核心工作流

安装好节点并配置好 API 密钥后,你就可以开始构建实用的工作流了。以下三个工作流涵盖了 Gemini 3.1 Flash Image 在 ComfyUI 中最常见的用例:从文本生成图像、编辑现有图像以及应用风格迁移。每个工作流都设计得尽量精简且功能完整,为你提供一个可用的起点,你可以根据需要用其他 ComfyUI 节点进行扩展。

文生图工作流

最基本的工作流将提示词节点连接到 NanoBanana2_Generate 节点,然后将输出接到 Save Image 节点。在画布上右键单击并添加一个 NanoBanana2_Generate 节点。在节点设置中,设置你想要的分辨率(1024 为默认值且最具性价比),选择宽高比(1:1 为正方形图片),然后在提示词字段中直接输入文本描述。将输出连接到 Preview Image 或 Save Image 节点,然后点击 "Queue Prompt" 生成你的第一张图像。在 1K 分辨率下生成通常在 3-5 秒内完成,4K 图像则需要 8-12 秒。

[Text Prompt] → [NanoBanana2_Generate] → [Save Image]
                  ├─ resolution: 1024
                  ├─ aspect_ratio: 1:1
                  └─ seed: -1 (random)

为了获得可复现的结果,将种子设置为特定数字而不是 -1。这样你可以在之后重新生成完全相同的图像,或者在保持整体构图稳定的同时进行小的提示词调整。ComfyUI_Nano_Banana 中的种子控制是真正的服务器端种子,意味着相同的种子配合相同的提示词每次都会产生完全一致的输出,这对于需要变体间一致性的专业工作流至关重要。

图像编辑工作流

图像编辑工作流允许你使用自然语言指令修改现有图像的特定部分。添加一个 Load Image 节点,将其连接到 NanoBanana2_Edit 节点的图像输入,然后在提示词字段中写入你的编辑指令。例如,加载一张房间照片并输入提示词 "将墙壁颜色改为深蓝色并添加一盏现代吊灯",将产生一个编辑版本,保留房间结构的同时进行请求的更改。这对于产品摄影和室内设计可视化特别有用,因为你可以在不从头开始的情况下探索各种变体。

[Load Image] → [NanoBanana2_Edit] → [Save Image]
                 ├─ prompt: "your editing instruction"
                 └─ resolution: match_input

编辑工作流在你的指令具体且有空间定位时效果最好。模糊的提示词如 "让它变得更好" 会产生不可预测的结果,而精确的提示词如 "将木桌换成一张玻璃茶几,保持相同的比例" 则能带来可靠的编辑效果。该模型理解空间关系、光照和透视,因此即使是复杂的场景修改,你的编辑也会在物理上合理。

使用参考图的风格迁移

最高级的工作流利用了 ComfyUI_Nano_Banana 独有的 14 张参考图功能。使用 Load Image 节点加载一张或多张参考图,将它们连接到 NanoBanana2_Generate 节点的参考输入。然后提供文本提示词描述你想要按照参考图风格生成的内容。该模型会从你的参考图中提取风格元素,如色彩方案、笔触、纹理和构图模式,并将它们应用到新生成的图像中。使用来自同一艺术风格的 3-5 张参考图通常能产生最连贯的结果,而使用单张参考图则会给出更宽松的诠释,将参考风格与模型自身的美学相融合。

[Load Ref 1] ─┐
[Load Ref 2] ─┤→ [NanoBanana2_Generate] → [Save Image]
[Load Ref 3] ─┘    ├─ prompt: "description + style"
                    └─ num_references: 3

对于跨多个提示词或参考集的批处理,请使用 NanoBanana2_BatchGenerate 节点。它接受一个文本文件的提示词(每行一个),按顺序为每个提示词生成图像,并以自动递增的文件名保存。这对于创建产品变体、生成训练数据集或制作需要数十张风格一致图像的社交媒体内容日历来说非常宝贵。

了解成本以及如何省钱

价格对比柱状图,展示官方 API、批处理和 laozhang.ai 的成本

成本透明度是现有 ComfyUI Gemini 教程中最大的空白。大多数指南提到了 token 定价(输入 $0.25/M,文本输出 $1.50/M,图像输出 $60.00/M token,根据 ai.google.dev),但从未将这些转化为创作者实际可以用来做预算的每张图片成本。事实上,你的每张图片成本主要取决于输出分辨率,而在 512px 和 4096px 之间生成的价格差异超过 3 倍。理解这种关系对于有效管理你的 API 支出至关重要。

通过官方 Google AI API 使用 gemini-3.1-flash-image-preview 的每张图片成本(根据 ai.google.dev 和 aifreeapi.com,2026 年 3 月验证)细分如下:0.5K 分辨率(512px)每张图片约 $0.045,默认的 1K 分辨率(1024px)每张图片约 $0.067,最大的 4K 分辨率(4096px)每张图片约 $0.151。Google 还为非实时工作负载提供批处理 API,享受 50% 的折扣,将 1K 成本降至每张约 $0.034。这些数字意味着,一个每月以默认 1K 分辨率生成 100 张图片的轻度用户大约需要花费 $6.70,而一个每月生成 2,000 张图片的重度用户通过标准 API 面临 $134 的账单,通过批处理 API 则为 $68。关于所有定价层级的全面拆解以及与 Pro 模型的对比,请参阅我们的详细 Gemini 图像生成定价分析

有几种实用策略可以在不牺牲输出质量的情况下降低成本。首先,使用满足你需求的最低分辨率。对于社交媒体缩略图和网页图形,1K(1024px)几乎总是足够的,当你最终要调整到 800px 时生成 4K 图像就是在浪费钱。其次,对于任何不需要实时结果的工作负载,利用批处理 API。如果你在夜间生成一组产品图片,以五折使用批处理显然是明智之选。第三,在 Google Cloud Console 中设置预算提醒,这样当你的支出接近阈值时会收到通知。这可以防止失控的批处理任务或意外留下的生成循环带来意外账单。

对于经常生成高分辨率(2K 和 4K)图像的用户,第三方 API 提供商可以带来可观的节省。laozhang.ai 提供对相同 gemini-3.1-flash-image-preview 模型的访问,无论分辨率如何,统一价格为每张图片 $0.05(2026 年 3 月验证,aifreeapi.com)。在 4K 分辨率下,与官方 API 的 $0.151 每张图片相比,这意味着 67% 的成本降低。该服务使用 OpenAI 兼容的端点,因此在 ComfyUI_Nano_Banana 中配置只需更改 API 基础 URL 和密钥。更多关于经济实惠的 Gemini 3.1 Flash Image API 访问选项,我们有专门的提供商对比和权衡分析。laozhang.ai API 的完整文档请访问 https://docs.laozhang.ai/。

常见问题排查

即使经过仔细的设置,在 ComfyUI 中使用 Gemini 图像生成的前几次会话中,你可能至少会遇到以下问题之一。这五个问题占据了节点仓库 GitHub Issues 中超过 90% 的支持问题,每个问题一旦知道了查找方向就有简单的解决方法。关于本文未涵盖的错误代码和边缘情况的完整列表,请参阅我们的完整错误排查指南

错误:403 Permission Denied 或 "Billing not enabled" 是目前最常见的问题,几乎每个新用户都会遇到。这意味着你的 Google Cloud 项目没有启用计费,或者计费刚启用还没有传播完成。解决方法是在 Google Cloud Console 的 Billing 下验证计费状态,确认已经关联了支付方式,如果刚刚启用则等待最多 60 分钟。尝试使用免费版进行图片生成永远会产生这个错误,因为 Google 明确将图片输出排除在免费配额之外。

错误:"Module not found" 或启动时的导入错误 表示节点的 Python 依赖没有正确安装。在终端中导航到 ComfyUI_Nano_Banana 目录并再次运行 pip install -r requirements.txt。如果你使用的是虚拟环境或 conda 环境,请确保在运行 pip 之前激活了正确的环境。在 Windows 便携安装上,使用随 ComfyUI 附带的嵌入式 Python 而不是系统 Python,以避免版本冲突。

错误:"Invalid API key" 或认证失败 即使使用有效的密钥也可能发生,前提是环境变量没有被正确读取。通过运行简单的 curl 命令测试你的密钥:curl -H "Authorization: Bearer YOUR_KEY" "https://generativelanguage.googleapis.com/v1beta/models"。如果返回了模型列表,说明你的密钥是有效的,问题出 在 ComfyUI 读取密钥的方式上。尝试将密钥直接粘贴到节点的 API 密钥字段中作为诊断步骤。如果这样可以但环境变量不行,请检查你的 shell 配置文件中是否有尾随空格或换行符。

图像生成为空白或黑色方块 通常意味着提示词触发了安全过滤器。Gemini 3.1 Flash Image 内置了内容审核,某些涉及暴力、色情内容或真实公众人物的提示词会产生空输出而不是错误消息。重新措辞你的提示词以避免被标记的词汇通常可以解决问题。如果无论提示词如何你都持续收到空输出,请验证你的分辨率设置在支持范围内(512-4096),并且你的宽高比是有效选项之一(1:1、4:1、1:4、8:1、1:8)。

生成速度慢或超时 通常是由网络延迟而非模型处理速度引起的。Gemini 3.1 Flash Image 通常在 1K 下 3-5 秒返回结果,4K 下 8-12 秒。如果你经历 30 秒以上的等待时间,请检查你的网络连接速度,并考虑 VPN 或代理是否增加了延迟。对于批量生成,节点默认按顺序发送请求。如果你需要更快的吞吐量,可以增加节点配置中的超时设置,并确保你的 API 配额没有因为发送过多并发请求而被限速。

立即开始生成图像

在 ComfyUI 中设置 Gemini 3.1 Flash Image Preview 是一个五分钟的过程,它能让你在现有工作流管线中直接使用云端驱动的 AI 图像生成。关键步骤是选择正确的节点(ComfyUI_Nano_Banana,ru4ls 开发,功能最全面)、为你的 API 密钥启用 Google Cloud 计费(大多数人遗漏的步骤),以及从 1K 分辨率默认设置开始,在探索模型能力的同时控制成本。

你接下来的步骤应该是直截了当且可操作的。首先,使用本指南中描述的 git clone 方法安装 ComfyUI_Nano_Banana,并验证节点出现在你的 ComfyUI 画布上。其次,创建一个 Google AI API 密钥并启用计费,然后通过生成一张带有描述性提示词的简单 1K 图像来测试密钥。第三,先构建文生图工作流作为基础,等你熟悉了基本操作后再转向图像编辑和风格迁移工作流。对于计划定期生成图像的用户,在 Google Cloud Console 中设置 $10 或 $20 的预算提醒,这样你可以在扩大使用量时监控支出。Gemini 的云端速度与 ComfyUI 的可视化工作流灵活性相结合,创造了一个强大的创意工具集,今天就开始意味着在大多数创作者甚至还没听说过这些节点之前,你就已经拥有了一个可投入生产的流水线。

分享文章:

laozhang.ai

一个 API,所有 AI 模型

AI 图片

Gemini 3 Pro Image

$0.05/张
官方2折
AI 视频

Sora 2 · Veo 3.1

$0.15/个
异步API
AI 对话

GPT · Claude · Gemini

200+ 模型
同官方价
已服务 10万+ 开发者
|@laozhang_cn|送$0.1