用 Nano Banana Pro 做换人时,先把参考图的职责写清楚:图 1 是身份来源,图 2 是目标场景或目标身体,提示词只允许指定内容迁移,其他姿势、服装、光线、背景和构图都要锁住。只处理你有权编辑的图片,不要生成非自愿亲密内容、欺骗性冒充、误导性证据或侵犯肖像和隐私的结果。
先复制这段基础提示词:
text将图 1 作为身份来源。将图 2 作为目标场景和身体参考。把图 1 中人物的身份迁移到图 2 的目标人物上,同时保留图 2 的姿势、服装、光线、镜头角度、背景和构图。匹配皮肤质感、阴影、透视和白平衡,让编辑结果自然融入目标照片。不要改变目标场景,不要新增人物,不要性化任何人,也不要制造欺骗性冒充。
运行前先选分支:
| 任务 | 适用情况 | 追加这一句 |
|---|---|---|
| 只换脸 | 图 2 的身体、衣服、姿势和背景都要保留。 | 只替换脸部和面部身份;身体、发型轮廓、服装、姿势和背景全部保留图 2。 |
| 整人替换 | 图 1 的人物要替换掉图 2 中可见的目标人物。 | 用图 1 的人物替换图 2 的目标人物,但保持目标场景、镜头、光线、比例和构图不变。 |
| 多人或相似人物 | 模型容易换错人或保留原人。 | 先给每个可见人物贴标签,再说明谁是来源人物、谁是唯一目标人物。 |
提示词为什么要这样写
弱提示词通常只说“把这个人换到这张图里”,模型就必须自己猜五件事:谁提供身份,谁提供身体,衣服是否要换,背景能不能动,结果是否会造成误导。换人任务一旦让模型自己猜,常见结果就是脸像贴上去、背景被重绘、衣服变掉,或者直接换错人。
更稳的写法是把任务拆成五个控制项:
| 控制项 | 负责什么 | 推荐写法 |
|---|---|---|
| 身份来源 | 谁的长相应该出现 | 图 1 是身份来源 |
| 目标场景/身体 | 哪张图决定姿势、身体、光线和背景 | 图 2 是目标场景和身体参考 |
| 迁移范围 | 从来源图迁移什么 | 只迁移面部身份 或 替换目标人物 |
| 锁定项 | 不能被模型改掉的内容 | 保留姿势、服装、光线、镜头角度和背景 |
| 禁止项 | 哪些输出属于错误或不安全 | 不要新增人物、不要性化、不要冒充 |

Nano Banana Pro 可以处理复杂的参考图编辑,但它仍然是在解释你的指令。Google 的图像提示建议强调清晰主体、直接编辑要求和参考图角色,同时也承认高级混合和角色一致性会有波动。因此不要把提示词当成“百分百换脸咒语”。正确目标是减少歧义,让失败可以定位,并把任务放在安全边界内。
如果你的目标不是单次换人,而是让同一个人跨多张图保持稳定,可以继续看 Nano Banana Pro 人脸一致性流程。换人是把身份迁移到一张目标图;一致性是让身份跨多场景持续稳定。
准备两张参考图
参考图质量比堆叠形容词更重要。图 1 要能清楚表达身份:脸部无遮挡,角度不要太极端,光线不要把五官压黑,也不要带太重滤镜。太阳镜、运动模糊、低清截图和夸张美颜都会迫使模型猜脸型和肤色,错误身份通常就是从这里开始。
图 2 要先决定它拥有的内容。只换脸时,图 2 拥有身体、发型轮廓、服装、姿势、背景、光线和镜头。整人替换时,图 2 拥有场景、镜头、光线、比例和构图,但可见目标人物可以被替换。如果不写清这个区别,模型可能把来源人物和目标身体混成一半,或者围绕来源图重建整张场景。
多人画面必须先贴标签:
text图 1 中,人物 A 是身份来源。图 2 中,人物 B 是唯一需要替换的目标人物。人物 C 保持不变。只把人物 A 的身份迁移到人物 B 的位置。
这句话看起来机械,但很有用。中文可见结果和论坛讨论里反复出现的问题不是“提示词不够华丽”,而是“模型不知道该动谁”。如果目标图里有两个人以上,先写一行画面清单,再写编辑要求。模型先理解角色,才有可能稳定执行迁移。
只换脸提示词
只换脸适合目标身体、衣服、姿势和背景都已经正确的场景。这是最窄、也最容易控制的分支。
text将图 1 作为身份来源,将图 2 作为目标照片。只把图 2 中目标人物的脸部和面部身份替换为图 1 的人物。保留图 2 的身体、发型外轮廓、服装、姿势、手部、背景、镜头角度、光线方向、景深和构图。匹配皮肤质感、面部阴影、透视、边缘融合、白平衡和颗粒感,让脸自然属于目标照片。不要改变目标场景,不要新增人物。
关键句是“只把脸部和面部身份替换”。如果没有范围限制,模型可能把图 1 的头发、衣服、身体比例甚至背景风格一起带过来。做整人替换时这可能有用,但做头像、证件照风格预览、家庭照片修复或服装保留任务时,这就是错误行为。
只换脸还要检查目标图的脸部朝向。如果图 1 是正脸,图 2 是大侧脸,模型必须重建不可见部分,稳定性会下降。更好的做法是换一张接近角度的身份图,或者先用更窄的任务测试脸部融合,再做最终版本。需要更强的人像光线和修饰控制时,可以参考 Nano Banana Pro 美颜头像流程。
整人替换提示词
整人替换用于来源人物要替换掉目标图里可见人物的情况。它比只换脸更难,因为模型必须同时处理身体、衣服、姿势、比例和场景关系。
text将图 1 作为身份和人物参考,将图 2 作为目标场景参考。用图 1 的人物替换图 2 中的目标人物,同时保留目标场景、相机位置、光线、背景、比例、透视和构图。让替换后的人物站在原目标人物相同的位置,保持自然身体比例。如果服装应来自图 2,就保留目标服装;如果服装应来自图 1,就迁移来源服装,并让它适配目标光线和姿势。不要改变无关人物、物体、文字或背景细节。
运行前必须决定身体归属。图 2 拥有身体和衣服,还是图 1 拥有整个人和服装?如果只是把来源脸放到目标身体上,不要叫整人替换,回到只换脸分支。很多奇怪结果都来自混用这三个任务:只换脸、换整个人、换脸但保留目标身体。
难画面可以拆成两步。第一步只让模型识别目标:“把红色外套人物标为人物 B,其他人保持不变。”第二步再执行替换。第一步不追求成图,只为了确认角色标签。确认角色后再生成,失败成本会低很多。
安全边界先于示例

换人提示词处理的是肖像和身份,所以安全规则不是页尾免责声明,而是提示词的一部分。只使用你拥有或获得授权的图片。不要用它制作非自愿亲密图、欺骗性冒充、伪造证据、羞辱骚扰内容,或让真实人物看起来做了他们没有做过的事。只要输出可能让普通观看者误解,就要披露编辑,或者不要发布。
公开使用前,可以把边界直接写进提示词:
text生成清晰非欺骗、已获授权的编辑结果。不要生成性化、羞辱、误导或冒充内容。保持自然效果,不要暗示人物执行了未经许可的行为。
这不是只为了规避风险。它也能告诉模型哪些输出应该被拒绝。如果你的意图无法通过这句话,说明任务本身不该生成。
修复常见失败

结果不对时,不要先加“更真实、更高清、更电影感”。先判断失败类型,再改角色契约。
| 失败表现 | 可能原因 | 修改提示词 |
|---|---|---|
| 换错人 | 目标人物没有贴标签。 | 先标记每个可见人物。人物 A 是身份来源,人物 B 是唯一替换目标,其他人保持不变。 |
| 脸换了但背景也变了 | 没有锁定目标场景。 | 保持图 2 的背景、镜头角度、光线、物体位置和构图不变。 |
| 脸像贴上去 | 融合约束太弱。 | 匹配皮肤质感、面部阴影、透视、边缘融合、白平衡和颗粒感。 |
| 身体或衣服乱变 | 身体归属不清。 | 保留图 2 的身体、服装、姿势和发型轮廓;只迁移面部身份。 |
| 整人替换后比例不对 | 没有锁定位置和透视。 | 将替换人物放在原目标人物相同的位置、比例、深度和透视中。 |
| 被拒绝或没有有效输出 | 可能越过安全或权利边界,也可能指令太模糊。 | 改成已授权、非欺骗的编辑任务,去掉亲密、冒充和误导意图,并重新贴标签。 |
如果同时出现多个问题,先修角色归属,再修真实感。脸部融合不自然可以通过阴影和色温改进;换错人说明模型没有理解任务。顺序应该是:标签、锁定、融合。
当前 Nano Banana Pro 路线说明
Nano Banana Pro 是读者常用的市场名称。开发者路线里,Google 文档把 Pro API 分支映射到 gemini-3-pro-image-preview。截至 2026 年 5 月 7 日,Google 的图像生成文档把 Nano Banana Pro 描述为更高保真度的 Gemini 3 Pro Image Preview 路线;Gemini 应用帮助则说明默认图像生成和编辑流程以 Nano Banana 2 为主,符合条件的付费用户可以用“Redo with Pro”一类的 Pro 重做路径。
路线差异会影响你在哪里测试提示词:
| 路线 | 适合什么 | 边界 |
|---|---|---|
| Gemini App | 手动编辑和快速重试。 | 可能先走 Nano Banana 2,再给符合条件的付费用户提供 Pro 重做入口。 |
| AI Studio / Gemini API | 可复现测试、开发流程、批量提示词验证。 | API 映射到 gemini-3-pro-image-preview,价格、免费层和预览限制都需要按日期核对。 |
| Vertex AI | 需要云项目、企业治理、区域和权限控制的团队。 | 可用性、区域和配额取决于项目配置。 |
如果问题是“找不到 Nano Banana Pro”,更适合看 Nano Banana Pro 使用路线图。如果问题变成 API Key、免费层或费用边界,请转到 Nano Banana Pro API Key 免费层说明,不要把提示词任务混成账单问题。
发布前 QA 清单
生成结果要按提示词合同复核,而不是只看第一眼像不像。
- 身份: 是否保留了目标身份的可识别特征,没有漂移成另一个人?
- 目标归属: 场景、身体、姿势、服装、背景、镜头角度和光线是否符合你选择的分支?
- 融合: 皮肤质感、边缘、阴影、白平衡和颗粒是否属于同一张照片?
- 无关内容: 其他人物、文字、物体、标志和背景细节有没有被改动?
- 安全: 你是否有授权,结果是否会在未披露时误导观看者?
如果安全检查失败,停止。归属检查失败,先改角色标签和锁定项。只有真实感失败时,才改融合语句。这个顺序能节省尝试次数,也能避免越修越偏。
一套更稳的执行顺序
如果你需要把结果发给客户、团队或公开账号,不要把第一次生成当成最终稿。更稳的做法是把换人流程拆成四轮,每一轮只验证一个问题。
第一轮验证角色。上传两张图后,只要求模型复述角色,不要求生成最终图。例如:“请确认图 1 的人物 A 是身份来源,图 2 的人物 B 是唯一目标人物,其他人物保持不变。”如果模型在这一轮已经把人物关系说错,后面的换脸或整人替换大概率也会错。先修标签,比反复生成更省时间。
第二轮验证锁定项。让模型执行低风险的小改动,重点看背景、服装、姿势、文字和其他人物是否被改掉。只要无关内容被改,就说明提示词里的“保持图 2”不够强。此时不要加“真实、高清、电影感”,而要加更具体的锁定项:背景物体位置、相机角度、光线方向、服装纹理、手部位置、文字内容。
第三轮才做正式迁移。只换脸时,强调脸部身份和目标身体分离;整人替换时,强调人物位置、身体比例和场景关系。这个阶段可以补充真实感约束,但不要让真实感覆盖角色约束。比如“自然融合”应该跟在“人物 B 是唯一目标”之后,而不是代替目标标签。
第四轮做发布复核。把输出和原目标图并排看,逐项检查是否有被模型悄悄改掉的内容。背景中的文字、路牌、商品 logo、手指、眼镜、项链、阴影方向都容易发生小漂移。需要公开发布时,最好把编辑事实写在说明里,避免观看者误以为这是一张未经编辑的真实照片。
这个顺序的价值在于把失败拆小。角色错了就修标签;场景乱了就修锁定项;脸不自然就修融合;安全边界过不了就停止。不要把所有问题都塞进一个超长提示词里,否则你很难知道是哪一句真正起作用。
还有一个实用习惯:每次改提示词只改一类变量,并把上一轮失败截图留在旁边。比如本轮只修“背景被改”,就不要同时改身份、服装和风格。下一轮只修“脸部融合”,就不要再改目标人物标签。这样你能判断新增句子是否真的解决了问题,也能避免把一次偶然成功误判成稳定方法。团队协作时,把最终采用的参考图顺序、提示词版本、失败类型和修正句一起记录下来,后续同类任务会快很多,也方便在需要复核授权、输出用途或客户反馈时快速还原当时的编辑条件。越是涉及真实人物,越需要留下这条小型审计线索。
常见问题
Nano Banana Pro 比 Nano Banana 2 更适合换人吗?
复杂参考图、长指令、最终交付图和高保真任务通常更适合 Pro 路线。Nano Banana 2 可能更容易在应用里启动,也可能更快。单次手动编辑可以先用可访问的入口;需要稳定测试和复现时,选择能控制参考图、提示词和模型路线的入口。
这段提示词能保证每次都是同一个人吗?
不能。提示词能减少歧义,提高身份保留概率,但不能保证完美。参考图清晰度、姿势接近程度、光线、遮挡和模型限制都会影响结果。公开或客户场景必须保留人工复核。
应该一步完成还是两步完成?
单人、清晰、只换脸的任务可以一步完成。多人、相似脸、模型总是换错人、整人替换改变场景时,先用一步标记目标人物,再用第二步执行替换。标记步骤能帮你在消耗正式生成前发现歧义。
可以用公众人物或别人的照片吗?
只有在你有权使用和编辑图片,并且结果不会欺骗、冒充、骚扰、性化或误导时才可以。无法解释为授权且非欺骗的编辑,就不要生成或发布。
为什么模型总是改变背景?
提示词没有把图 2 的背景锁住。加上:“保持图 2 的背景、镜头角度、光线方向、物体位置、文字和构图不变。”如果图 1 风格很强,再补一句“不要迁移图 1 的风格”。
API 调用失败但还没开始编辑怎么办?
那已经不是提示词问题。检查文件类型、上传路径、配额、请求大小和模型可用性。传输、限额和模型调用错误更适合看 Gemini 图片常见错误检查表。
