方法论与洞察

GPT Image 2 锁脸的「脸占比上限」

验证等级:⚠️ 首次发现(暂时性,不能升格铁律,需二次跨场景复现后升 ⭐⭐) 日期:2026-06-24 工具:GPT Image 2(上传参考图 + 自然语言图生图) 场景:朋友给人物参考图(图1),要求保人脸一致做同人改绘(坐花藤秋千·星空夜景·侧脸虚影叠影)


一、事实区(冻结,不可改)


二、核心洞察

在「全身远景 + 重度风格化场景」下,脸只占画面极小一块像素,GPT Image 2 会优先服从风格、牺牲身份。 这是工具硬上限,不是 prompt 没写好。规律:场景越华丽、人物越小,脸越容易跑。

身份锚点最先丢失——参考图最强的单一特征(本例=蓝灰色眼睛)是判断锁脸成败的锚点。出图先看锚点有没有还原,不必逐项比对五官。锚点丢 = 锁脸失败。


三、可复用打法

0. prompt 开头必须显式禁止美化(GPT Image 2 默认会顺手美化导致跑脸): keep her EXACT facial identity — same face shape, eyes, nose, lips, skin tone. Do not beautify or alter her features. 比例用自然语言(Vertical 2:3 portrait),不吃 --ar

三级补救阶梯(按性价比排序):

  1. 方案A 对话式微调(首选,最省事,本例从 85%→92%): The face is not matching the reference photo. Regenerate with her EXACT face from the attached photo: [点名锚点,如 rounder face, larger blue-grey eyes, gentler expression]. Keep everything else (pose, scene, outfit) the same. 优势:只动脸不动景,是教科书级的”低损伤微调”。

  2. 方案B 拉近景别(成功率最高):全身→半身/七分身,脸占比一上去锁脸立刻稳。代价:裁掉脚和下半场景。当核心卖点是”脸+氛围”时值得换。

  3. 方案C 两步合成(终极):先单独出脸部特写确认锁脸 → 再融合氛围图。要求最高时用。


四、收尾铁律

锚点对上 + 气质对上 + 场景完整 = 可定稿。不要为修小瑕疵(如脚趾)重抽——重抽有脸再次跑偏的风险,见好就收。


五、与既有方法论的关系