GPT Image 2 锁脸的「脸占比上限」
验证等级:⚠️ 首次发现(暂时性,不能升格铁律,需二次跨场景复现后升 ⭐⭐) 日期:2026-06-24 工具:GPT Image 2(上传参考图 + 自然语言图生图) 场景:朋友给人物参考图(图1),要求保人脸一致做同人改绘(坐花藤秋千·星空夜景·侧脸虚影叠影)
一、事实区(冻结,不可改)
- 参考图特征:温婉圆脸、蓝灰色大而圆的眼睛、气质温婉。
- 第一次出图(全身远景):场景几乎满分还原(秋千/花藤/侧脸虚影/满月/楼阁山峦/调色全中),但脸跑了——变成瘦削尖下颌、褐色细长眼、妩媚冷淡。锁脸约 85%(场景对、人不对)。
- 第二次出图(方案A 对话式微调):追加点名锚点的修正指令后,蓝灰眼回来了、脸型柔和回来、气质回来,场景几乎零损伤。锁脸约 92%。
- 结论被用户认可为「这就是 GPT Image 2 的工具上限,脸占比太小它做不到」。
二、核心洞察
在「全身远景 + 重度风格化场景」下,脸只占画面极小一块像素,GPT Image 2 会优先服从风格、牺牲身份。 这是工具硬上限,不是 prompt 没写好。规律:场景越华丽、人物越小,脸越容易跑。
身份锚点最先丢失——参考图最强的单一特征(本例=蓝灰色眼睛)是判断锁脸成败的锚点。出图先看锚点有没有还原,不必逐项比对五官。锚点丢 = 锁脸失败。
三、可复用打法
0. prompt 开头必须显式禁止美化(GPT Image 2 默认会顺手美化导致跑脸):
keep her EXACT facial identity — same face shape, eyes, nose, lips, skin tone. Do not beautify or alter her features.
比例用自然语言(Vertical 2:3 portrait),不吃 --ar。
三级补救阶梯(按性价比排序):
-
方案A 对话式微调(首选,最省事,本例从 85%→92%):
The face is not matching the reference photo. Regenerate with her EXACT face from the attached photo: [点名锚点,如 rounder face, larger blue-grey eyes, gentler expression]. Keep everything else (pose, scene, outfit) the same.优势:只动脸不动景,是教科书级的”低损伤微调”。 -
方案B 拉近景别(成功率最高):全身→半身/七分身,脸占比一上去锁脸立刻稳。代价:裁掉脚和下半场景。当核心卖点是”脸+氛围”时值得换。
-
方案C 两步合成(终极):先单独出脸部特写确认锁脸 → 再融合氛围图。要求最高时用。
四、收尾铁律
锚点对上 + 气质对上 + 场景完整 = 可定稿。不要为修小瑕疵(如脚趾)重抽——重抽有脸再次跑偏的风险,见好就收。
五、与既有方法论的关系
- 与
微调的边界.md:本条是”脸占比”这一具体边界的工具实测补充。 - 与
双工具分工_nano锁脸+MJ摄影质感_v1.md:同属”单工具锁脸有上限 → 分工/分步绕过”的家族;GPT Image 2 在小脸占比下的上限,正是分步合成存在的理由。 - 待验证升格:下次任意图生图同人改绘复现”全身跑脸→对话拽回锚点”,即可升 ⭐⭐。