Google Gemini 可以通过多种方式更换、去除和替换图片背景——从免费的 Gemini 应用到强大的开发者 API。无论你想把杂乱的房间换成专业的摄影棚背景、完全去除背景生成透明 PNG,还是使用局部修复功能选择性编辑图片的特定区域,截至2026年3月,Gemini 至少提供了七种不同的方法。本指南将逐一介绍每种方法,包含实测提示词、可运行的代码以及真实的费用对比,帮你根据具体需求选择最合适的方案。
Gemini 在图片背景编辑方面的实际能力

Google 已经在其生态系统的多个产品中内置了背景编辑功能,这既强大又容易让人困惑。在深入了解具体方法之前,先理解实际可以做什么以及哪个 Gemini 模型负责什么功能会很有帮助。Nano Banana 2 模型(技术名称为 gemini-3.1-flash-image-preview)和 Nano Banana Pro 模型(gemini-3-pro-image-preview)是为 Gemini 图片编辑提供动力的两个主要模型。两者都支持上传现有照片并通过自然语言提示词进行修改,但在速度、质量和费用方面有所不同。
Nano Banana 2 是速度更快的选项,能在大约3到8秒内生成编辑后的图片,分辨率最高可达4K。它在大多数常见场景下都能很好地处理背景更换,比如将房间背景换成海滩场景或去除产品照片背后的杂物。Nano Banana Pro 需要更长时间——通常10到20秒——但能产出更高保真度的结果,特别是在主体与背景之间的边界涉及头发丝或透明物体等精细细节的复杂场景中表现尤为出色。对于不需要替换的纯背景去除操作,两个模型都能产出干净的结果,不过 Pro 在处理边缘情况时表现更好。
除了原生 Gemini 模型之外,Google 还通过 Vertex AI 提供 Imagen 3.0,它带有专业的遮罩模式,专门用于背景替换流水线。这是一个针对编辑操作而非通用图片生成而优化的独立系统。此外还有 Google Slides、Google Drawings 和 Google Photos 中面向消费者的集成功能,它们使用简化版的这些能力,通过简单的点击界面实现。最终形成了从零代码消费级工具到完整 API 流水线的一系列选项,每种都在质量、费用和灵活性方面有不同的取舍。以下各节将按复杂度从低到高逐一介绍每种方法,从最简单的免费选项开始。
方法一:在 Gemini 应用中更换背景(免费)
使用 Gemini 更换图片背景最简单的方式是通过 Gemini 应用本身,可以在 gemini.google.com 或手机应用中操作。这种方法对基础使用完全免费,只需要一个 Google 账号即可。整个过程是对话式的——你上传一张照片,用自然语言描述你想要的更改,Gemini 就会返回编辑后的版本。
要开始操作,打开 Gemini 应用并点击图片上传按钮(聊天输入区域中的加号图标)。从设备中选择你想编辑的照片。图片出现在聊天中后,输入描述你想要的背景更改的提示词。例如,你可以写:"将背景替换为日落海滩场景。保持人物完全不变。将温暖的光线与新背景匹配。"Gemini 会处理图片并返回一个或多个编辑后的版本,你可以直接下载。
结果的质量在很大程度上取决于你的提示词。模糊的指令如"更换背景"往往会产生意想不到的结果,因为模型不知道你想要什么样的新背景。具体的提示词——同时描述所需背景和保留指令——能持续产出更好的输出。在2026年3月进行的测试中,明确声明"保持主体/人物不变"并结合详细背景描述的提示词,约有80%的成功率能达到最佳效果。如果没有保留指令,模型有时会对主体的外观或服装做出微妙的不必要更改。
Gemini 应用方法的一个重要限制是它无法直接产出透明背景。当你要求 Gemini "去除背景"时,它通常会用纯白色或上下文生成的背景替换,而不是创建透明 PNG。有一个变通方法:你可以要求 Gemini 将背景设为特定的纯色(如亮绿色),然后使用其他工具去除该颜色,但这增加了额外步骤。对于需要透明背景的用户,后续章节中描述的 API 方法提供了更直接的途径。
另一个常见的困扰是安全过滤器。如果你上传的照片包含某些元素——特别是在某些情况下的清晰人脸——Gemini 可能会回复"抱歉,我暂时无法为你编辑图片。"这不是 bug,而是为防止深度伪造式操控而设的刻意安全措施。本文后面的故障排除部分会准确解释这种情况何时触发以及如何合理地绕过它。
Gemini 应用还在移动设备上支持图片标注编辑功能,你可以用手指圈出图片的特定区域来指示想要更改的位置。这对背景编辑特别有用,因为你可以圈出背景区域然后输入"用[新背景]替换这里"。标注工具于2025年底作为 Nano Banana 模型更新的一部分推出,为用文字描述空间位置提供了更直观的替代方案。使用标注进行背景更改时,模型往往能产出更清晰的主体-背景边界,因为它有关于编辑边界应在哪里的明确视觉引导。这是移动端 Gemini 应用实际上提供了桌面版和 API 无法复制的能力的一个案例——视觉标注功能是移动端独有的,对于主体轮廓不规则的复杂背景编辑来说具有显著的质量优势。
方法二:在 Google Slides 和 Workspace 中去除背景
对于已有 Google Workspace 订阅的用户来说,Google Slides 和 Google Drawings 提供了内置的背景去除工具,该工具由 Gemini AI 驱动,但通过简单的点击界面访问。这种方法非常适合演示文稿工作流程,你可以快速去除图片背景并将其叠加到幻灯片设计上。
要使用此功能,将图片插入 Google Slides 演示文稿中,点击图片选中它,然后从工具栏选择"编辑图片"并选择"去除背景"。AI 会自动处理图片并去除背景,留下主体的剪切图,你可以将其放置在任何幻灯片背景上。该过程通常只需要一到两秒,对于主体与背景分离清晰的图片效果很好。
关键要求是此功能仅在付费的 Google Workspace 方案中可用。具体来说,你需要 Google Workspace Business Standard 或更高版本、Enterprise Standard 或更高版本,或者每月19.99美元的 Google One AI Premium 个人订阅(Google Workspace 定价,2026年3月)。如果你使用的是免费 Google 账号或基础版 Workspace Starter 方案,菜单中不会出现"去除背景"选项。这使它成为一个方便但非免费的解决方案——你实际上是作为更广泛的生产力订阅的一部分在为背景去除付费。
质量通常对于演示文稿来说是足够好的,但不如通过 API 方法所能达到的精确。主体与背景之间高对比度的图片能产出干净的结果,而主体融入背景(相似颜色、柔和边缘)的照片可能会留下可见的瑕疵。与 Gemini 应用方法不同,Slides 的背景去除确实在演示文稿环境中产出真正的透明剪切图,这对设计工作流程来说是一个显著优势。
值得注意的是,Google Drawings 也支持相同的背景去除功能,所有拥有合格方案的 Workspace 用户都可使用。虽然 Drawings 不如 Slides 常用,但如果你需要去除背景并将结果导出为图片文件而不是嵌入演示文稿中,它会很有用。工作流程完全相同:插入图片、选中它、选择"编辑图片"然后"去除背景"。Google Vids 这个 Workspace 中较新的视频创建工具也在视频编辑界面中为视频缩略图和静态帧整合了背景去除功能。
方法三:通过 Google AI Studio 去除和替换背景(免费层)
Google AI Studio 为开发者和高级用户提供了一个免费层选项,他们需要比 Gemini 应用更多的控制但不想设置完整的 Google Cloud 项目。AI Studio 可在 aistudio.google.com 通过任何 Google 账号访问,提供对 Gemini 模型的直接访问,包括图片编辑功能。
在 AI Studio 中,你可以使用 Gemini 3.1 Flash Image 模型或 Gemini 3 Pro Image 模型来执行背景编辑。界面允许你上传图片、编写提示词并调整温度和响应格式等参数。免费层根据模型不同每天提供约50到500次请求(Google AI Studio,2026年3月),对于个人项目和测试来说已经足够。对于背景编辑,你可以构建与 Gemini 应用中使用的相同提示词,但额外获得了模型选择和参数调整的好处。
AI Studio 在背景编辑方面的真正价值在于它是承诺投入 API 集成前的测试场。你可以尝试不同的提示词和模型,比较 Nano Banana 2 和 Nano Banana Pro 对你的特定用例的输出质量,并在编写任何代码之前完善你的方法。一旦找到了能持续产出好结果的提示词,你可以使用相同的模型 ID 和参数将该工作流程直接转化为 API 调用。这架起了从随意消费级使用到完整开发者集成的桥梁,使其成为不可或缺的中间步骤。
Gemini 背景去除和替换的最佳提示词

平庸的背景编辑和专业级效果之间的差别,几乎总是取决于提示词的质量。在2026年3月对 Gemini 应用和 API 进行了数十个提示词测试后,几种模式持续产出了优于其他的结果。以下提示词按用例整理,可以直接复制到 Gemini 应用中或通过 API 以文本内容形式发送。
背景替换提示词在你详细描述新背景并明确指示模型保留主体时效果最佳。像"将背景替换为安静的、薄雾笼罩的日式竹林黎明场景。将主体上的光线和色温匹配到新背景。保持主体的每一个细节完全不变。"这样的提示词产出的结果远好于简单说"换成森林背景"。关键要素包括:具体的场景描述、光线指示和明确的保留指令。对于产品摄影,像"将这个产品放在干净的白色大理石台面上,柔和的摄影棚灯光从左上方照射。去除所有现有背景元素。在产品下方创建微妙的阴影以增加真实感。"这样的提示词效果特别好,因为它们同时引导了模型处理新背景和光照物理效果。
背景去除提示词需要指定用什么替换背景,即使你想要"什么都没有"。获得纯白色背景最可靠的提示词是:"完全去除背景。用纯白色(#FFFFFF)替换。保持主体及其所有细节完美保留。主体周围的边缘要干净、锐利。"如果你需要白色以外的特定颜色,只需替换颜色描述即可。在 Gemini 应用中获得最接近透明背景效果的提示词是:"完全去除背景。用纯亮绿色(#00FF00)背景替换。在主体周围保持完美干净的边缘。"然后你可以通过任何标准背景去除工具处理绿幕结果来实现真正的透明。
局部修复和选择性编辑提示词需要你描述要修改图片的哪个部分。当你想在保留其余部分的同时去除特定物体时,使用:"从图片中去除[物体描述]。用周围背景的上下文自然填充该区域。不要修改图片中的任何其他内容。"要在背景中添加元素,尝试:"在主体后方的背景中添加[元素描述]。与现有场景的光线和透视自然融合。"这些提示词之所以有效,是因为它们为模型明确划分了更改和保留的边界。
有几个提示词工程原则无论具体编辑内容如何,都能持续改善结果。第一,即使你处理的是其他语言的内容,也始终使用英语提示词——Gemini 模型在图片编辑任务中使用英语指令时表现更稳定。第二,每次提示词聚焦一个编辑。像"去除背景并且更改人物的衬衫颜色"这样的复合请求经常在两个目标上都产出糟糕的结果。改用多轮编辑,每个对话轮次做一个更改。第三,在使用 API 时在提示词开头包含"Generate an image:"这个短语,因为这明确向模型发出信号,表示你期望的是图片输出而非对图片的文字分析。
Gemini API 背景编辑:开发者指南
对于需要将背景编辑集成到应用程序中的开发者来说,Gemini API 提供了与消费级产品中相同编辑功能的程序化访问。主要有两种方式:使用自然语言的无遮罩编辑和实现精确控制的基于遮罩的编辑。两种方式都可以通过标准 Gemini API 端点访问,并且兼容 OpenAI 库格式,如果你已经在使用其他 AI API,集成将非常简单。
无遮罩背景编辑是更简单的方式。你发送原始图片和描述所需更改的文本提示词,模型会自动处理分割。这与 Gemini 应用的工作方式相同,只是通过程序访问。以下是使用 OpenAI 兼容 API 格式的可运行 Python 示例:
pythonimport openai import base64 client = openai.OpenAI( api_key="YOUR_API_KEY", base_url="https://generativelanguage.googleapis.com/v1beta/openai/" ) with open("photo.jpg", "rb") as f: image_data = base64.b64encode(f.read()).decode("utf-8") response = client.chat.completions.create( model="gemini-2.0-flash-exp-image-generation", messages=[{ "role": "user", "content": [ { "type": "text", "text": "Replace the background with a professional studio setting. Keep the subject unchanged." }, { "type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"} } ] }] )
基于遮罩的背景编辑让你对要修改的区域拥有像素级别的控制。你需要提供两张图片:原始照片和一个黑白遮罩,其中白色像素表示要编辑的区域,黑色像素表示要保留的区域。这种方式对于产品摄影、电商目录以及任何需要精确边界的场景来说是必不可少的。API 调用结构类似,但你在消息内容中同时包含原始图片和遮罩:
pythonresponse = client.chat.completions.create( model="gemini-2.0-flash-exp-image-generation", messages=[{ "role": "user", "content": [ { "type": "text", "text": "First image is the original. Second image is the mask. Replace the white masked area with an outdoor garden scene." }, { "type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{original_b64}"} }, { "type": "image_url", "image_url": {"url": f"data:image/png;base64,{mask_b64}"} } ] }] )
对于构建生产应用的用户来说,Vertex AI Imagen 模型(imagen-3.0-capability-001)提供了专门的编辑流水线,具备自动背景检测(MASK_MODE_BACKGROUND)、可配置的遮罩膨胀和批处理支持等专业功能。该模型每次编辑操作费用约为0.02美元(Vertex AI 定价,2026年3月),专门为编辑而非通用图片生成进行了优化。取舍在于它需要启用计费的 Google Cloud 项目,相比标准 Gemini API 增加了设置复杂性。
多轮对话式编辑是第三种 API 方式,通过在单个对话线程中在之前的编辑基础上构建来实现。你发送初始图片和第一次编辑请求,在响应中收到编辑后的图片,然后发送引用之前结果的后续消息并附带新的编辑指令。这允许渐进式精修——例如,你可以先替换背景,然后在第二轮调整光线,最后在第三轮细化边缘细节。关键优势在于每次后续编辑都保留了之前轮次的更改,所以你不会在步骤之间丢失工作。这种方式对于单个提示词无法准确捕捉所有期望更改的复杂编辑场景特别有价值,它模拟了人类编辑处理多步骤修图任务的方式。
对于处理大量图片的生产应用,有几种架构模式值得考虑。基于 Redis 或 RabbitMQ 的队列系统可以通过合理间隔请求来优雅地管理 API 速率限制,在保持吞吐量的同时不超过 IPM 限制。对于图片密集型电商网站,异步编辑产品图片并缓存结果的后台处理流水线可以在不产生每次请求 API 延迟的情况下提供编辑后的图片。Vertex AI 的批量 API 专为此用例设计,与同步调用相比提供50%的价格折扣。
如果你正在处理大量图片,像 laozhang.ai 这样的服务商提供按统一价格每张图片0.05美元访问 Gemini 图片模型,无论分辨率如何,对于混合分辨率的工作负载来说可能比官方定价更具成本效益。API 格式与标准 OpenAI 库兼容,因此切换服务商通常只需要更改 base URL 和 API key。想深入了解图片生成的 API 费用优化,请参阅我们的 Gemini 图片 API 定价完全指南。
修复"抱歉,我无法编辑图片"及其他常见错误
Gemini 图片编辑用户最令人沮丧的体验就是遇到消息"抱歉,我暂时无法为你编辑图片。我可以生成一张图片吗,或者帮你做些其他事情?"这个错误在 Reddit 和 Gemini Apps 社区论坛上引发了数千条投诉,理解它发生的原因对于有效使用 Gemini 至关重要。
根本原因是 Gemini 的多层安全系统。当你上传照片并请求编辑时,模型会在处理编辑请求之前先分析图片是否包含敏感内容。如果图片包含可识别的人脸,且编辑可能产生误导性结果——例如更改某人的外观、将某人放在不同的位置或修改服装——安全过滤器会完全阻止编辑。这是 Google 防止深度伪造式滥用的方法,同样适用于 Gemini 应用、AI Studio 和 API 访问。该过滤器在2026年3月被收紧,扩展到涵盖名人面孔、图片中的财务信息和某些服装修改等额外类别。
根据你的用例,有几种合理的解决方法。对于有人穿着产品的产品摄影,将提示词重新措辞以聚焦产品而非人物。不要说"更换这个人身后的背景",而是尝试"更换这个产品后面的背景。产品是这张图片的焦点。"这种重构有时可以绕过安全过滤器,因为模型将请求解释为产品编辑而非人物编辑。对于安全过滤器错误触发的风景或物体照片,尝试从描述中去除任何可识别特征,并保持提示词纯粹聚焦于背景元素。
在使用 API 时,安全过滤器的行为取决于模型和配置。标准 Gemini API 默认应用安全过滤器,当内容被阻止时返回 finishReason 为 SAFETY 或 IMAGE_SAFETY。在 Vertex AI 上,你可以配置 harm_block_threshold 参数来调整可配置类别(骚扰、仇恨言论、色情内容、危险内容)的敏感度。但是,某些类别——特别是儿童安全和法律合规——无论配置如何都无法绕过。这些第二层过滤器是硬编码的,会返回 blockReason 为 OTHER,任何配置更改都无法覆盖。
其他常见错误包括在快速连续发出过多 API 请求时的速率限制(HTTP 429)。Gemini API 在多个层面实施速率限制:每分钟请求数(RPM)、每分钟令牌数(TPM)和每分钟图片数(IPM)。对于背景编辑操作,IPM 限制通常是最紧的约束。在免费层,你每分钟限制约10个图片生成请求,这意味着批处理工作流程需要在请求之间包含适当的延迟。关于有效处理速率限制的策略,请参阅我们的专题 Gemini 图片 API 速率限制解决指南。
偶尔出现的"200 OK 但没有图片"响应可能在模型生成的内容通过了初始过滤器但在输出期间触发了二次检查时发生——这是一个已知行为,通常通过稍微修改提示词重试即可解决。如果你在同一张图片上持续遇到这种情况,通常意味着内容对安全过滤器来说处于边界状态。尝试裁剪图片以更紧密地聚焦主体、去除文字叠加层,或调整提示词以更明确地说明保持主体当前外观。
一个较少被讨论的错误是模型返回完全重新生成的图片而不是原始图片的编辑版本。当提示词对于是要编辑还是生成新图片含糊不清时就会发生这种情况。修复方法是始终在提示词中包含对上传图片的明确引用,如"编辑这张上传的照片"或"修改我的图片中的背景",而不是可能被解释为新图片生成请求的泛泛描述。
费用对比:所有背景编辑方法排名

了解每种背景编辑方法的真实费用有助于你根据预算和处理量选择正确的方案。定价范围从休闲使用的完全免费到大批量 API 访问的每张图片几分之一美分。以下所有价格均已核实,数据来源为截至2026年3月的官方来源。
免费层选项可以满足大多数个人和小型企业需求。Gemini 应用完全免费,没有每张图片的费用,仅受 Google 未精确公布的总体使用上限限制,但大多数用户在正常使用中永远不会达到上限。Google AI Studio 提供免费 API 访问,根据模型不同每天约有50到500次请求,适合测试和低量生产使用。如果你已有合格的 Workspace 订阅,Google Slides 背景去除功能是免费的,但如果没有则需要至少每月19.99美元的 AI Premium 方案。
对于大规模的基于 API 的处理,费用取决于模型和分辨率。Nano Banana 2(Gemini 3.1 Flash Image)通过官方 API 在1K分辨率下每张图片约0.067美元,在0.5K时降至约0.045美元,在4K时升至0.151美元(ai.google.dev/pricing,2026年3月)。Nano Banana Pro(Gemini 3 Pro Image)更贵,标准分辨率下每张图片约0.134美元。Vertex AI Imagen 编辑操作每次约0.02美元,使其成为纯背景操作中最具成本效益的官方选项。关于批量 API 费用优化策略,Vertex AI 还提供批处理50%折扣,将每次编辑费用降至约0.01美元。
第三方服务商提供的替代定价在某些用例中可能更有优势。像 laozhang.ai 这样的服务商无论分辨率如何,每张图片统一收费0.05美元,对于2K和4K图片来说比官方定价更便宜,但对于0.5K图片来说略贵。作为对比,remove.bg 在其 API 方案上每张图片约收费0.20美元,ChatGPT 的 GPT Image 1.5 根据质量设置每张图片收费0.034到0.133美元,Adobe Photoshop 需要每月22.99美元的订阅才能使用手动背景编辑功能。
对于大多数用户,实用建议是:偶尔编辑从免费 Gemini 应用开始,需要更多控制或更高处理量时转到 AI Studio 免费层,只有在需要程序化集成或定期处理数百张图片时才投入 API 访问。方法之间的费用差异在大批量时最为显著——通过 Vertex AI Imagen 处理1000张产品照片每张0.02美元共计20美元,而通过 Nano Banana Pro 每张0.134美元则需要134美元,在相同的底层 Google 基础设施上差距近7倍。
Gemini vs ChatGPT vs Photoshop:背景编辑对比
用户经常问 Gemini 还是 ChatGPT 更适合图片背景编辑,答案取决于你的具体需求。两个平台在2026年初都已经相当成熟,但它们采用不同的方式,擅长不同的领域。想了解更详细的模型层面对比,请参阅我们的 Nano Banana 2 与 GPT Image 1.5 深度分析。
Gemini 在背景编辑方面的主要优势是其慷慨的免费层和与 Google 生态系统的原生集成。你可以在 Gemini 应用中免费编辑图片,无需订阅;通过 Google AI Studio 的免费层访问 API 级别的编辑功能;并在 Google Slides 中使用内置的背景去除功能。编辑质量非常出色,特别是 Nano Banana Pro 模型处理复杂场景时。Gemini 还通过原生和 Vertex AI 两种方式支持基于遮罩的编辑,为开发者提供精确控制。
配备 GPT Image 1.5 的 ChatGPT 通过 ChatGPT 界面和 API 提供了强大的背景编辑能力。质量与 Gemini 不相上下,ChatGPT 在替换背景时有时能产出更自然的光线调整效果。然而,ChatGPT 不提供免费的图片编辑 API 层——最便宜的选项是低质量下每张图片0.034美元,并且界面需要 ChatGPT Plus 订阅(每月20美元)才能可靠地使用图片编辑功能。ChatGPT 也缺乏与 Vertex AI Imagen 相当的专门的基于遮罩的编辑模式。
Photoshop 仍然是精确背景编辑的黄金标准,特别适合需要像素级完美控制的专业摄影师和设计师。其由 Adobe Firefly 驱动的"去除背景"操作和生成式填充功能非常强大。然而,Photoshop 需要每月22.99美元的订阅,学习曲线陡峭,不提供自动化 API,并且一次只能处理一张图片(除非你设置复杂的批处理操作)。对于需要任何规模的简单背景更换的大多数用户来说,Gemini 以极低的费用和复杂度提供了 Photoshop 90%的质量。
底线是:选择 Gemini 获得免费或低成本且质量出色的背景编辑;如果你已在 OpenAI 生态系统中并重视自然光线效果,选择 ChatGPT;只有在需要对每个边缘进行像素级完美的手动控制时才选择 Photoshop。
一个值得提及的新兴替代方案是按顺序使用多个 AI 工具。一些专业人士通过使用 Gemini 生成背景替换(利用其强大的场景生成能力),然后使用 remove.bg 或 rembg 等专门工具进行最终边缘清理,取得了出色的效果。这种混合方式每张图片的费用略高,但产出的结果可以与手动 Photoshop 编辑媲美,而时间投入只是其一小部分。对于大规模的电商产品摄影来说,这种流水线方式正在成为行业标准——你可以在我们的 AI 产品摄影指南 中了解更多关于构建此类工作流程的内容。
常见问题解答
Gemini 可以免费去除背景吗?
可以。gemini.google.com 上的 Gemini 应用允许通过文本提示词免费去除和替换背景。上传你的图片并描述你想要的更改即可。免费层有总体使用限制但没有每张图片的费用。对于真正的透明背景输出,你需要使用 API 或变通方法(纯色背景+外部去除工具)。
为什么 Gemini 说"抱歉,我暂时无法为你编辑图片"?
这个错误发生在 Gemini 的安全过滤器检测到编辑可能操控上传照片中人物外观时。它旨在防止深度伪造式的滥用。常见触发条件包括请求更换可识别面孔后面的背景、修改服装或改变人物的位置场景。解决方法包括将提示词重新聚焦在物体而非人物上,或在适当情况下使用调整了安全设置的 API。
哪个 Gemini 模型最适合背景编辑?
从速度和成本效率来看,Nano Banana 2(gemini-3.1-flash-image-preview)以每张图片约0.067美元和3到8秒的处理时间提供了最佳平衡。对于复杂编辑的最高质量,Nano Banana Pro(gemini-3-pro-image-preview)每张图片约0.134美元,能产出更干净的边缘和更好的细节处理,如头发丝。对于生产环境的专门背景替换,Vertex AI Imagen 每次编辑0.02美元,提供最具成本效益且可靠的选项。
可以使用 Gemini API 进行批量背景去除吗?
可以。标准 Gemini API 和 Vertex AI Imagen 都支持程序化访问,实现批量处理。你可以编写脚本遍历图片文件并发送 API 请求来处理数百甚至数千张图片。Vertex AI 还提供专门的批量 API,对大批量处理提供50%的价格折扣。关于实现细节,请参阅我们的批量 API 费用优化指南。
Gemini 背景编辑与 remove.bg 相比如何?
Gemini 以更低的成本提供更多灵活性(背景替换、局部修复、风格更改),而 remove.bg 是一个专门的背景去除工具,能持续产出干净的透明 PNG。remove.bg 通过 API 每张图片约收费0.20美元,而 Gemini 的范围是0.02到0.13美元。如果你只需要去除背景到透明,remove.bg 可能更容易实现,但 Gemini 能以更低的费用完成 remove.bg 能做的一切以及更多功能。
Gemini 背景编辑在手机上可用吗?
可以。Android 和 iOS 上的 Gemini 手机应用支持与网页版相同的图片编辑功能,还额外具备图片标注功能。在手机上,你可以用手指圈出图片的特定区域来精确指示你想要更换背景或去除物体的位置。这个标注工具比纯文字描述提供了更直观的空间控制,是手机应用独有的功能。手机应用还支持直接从相册上传照片,方便随时随地进行快速编辑。在 Pixel 设备上,Google Photos 通过魔法橡皮擦和魔法编辑器功能集成了类似的背景编辑功能,这些功能使用相同的底层 AI 模型。
