方法论与洞察

GPT Image 2 锁脸的「脸占比上限」

验证等级：⚠️ 首次发现（暂时性，不能升格铁律，需二次跨场景复现后升 ⭐⭐）日期：2026-06-24　工具：GPT Image 2（上传参考图 + 自然语言图生图）场景：朋友给人物参考图（图1），要求保人脸一致做同人改绘（坐花藤秋千·星空夜景·侧脸虚影叠影）

一、事实区（冻结，不可改）

参考图特征：温婉圆脸、蓝灰色大而圆的眼睛、气质温婉。
第一次出图（全身远景）：场景几乎满分还原（秋千/花藤/侧脸虚影/满月/楼阁山峦/调色全中），但脸跑了——变成瘦削尖下颌、褐色细长眼、妩媚冷淡。锁脸约 85%（场景对、人不对）。
第二次出图（方案A 对话式微调）：追加点名锚点的修正指令后，蓝灰眼回来了、脸型柔和回来、气质回来，场景几乎零损伤。锁脸约 92%。
结论被用户认可为「这就是 GPT Image 2 的工具上限，脸占比太小它做不到」。

二、核心洞察

在「全身远景 + 重度风格化场景」下，脸只占画面极小一块像素，GPT Image 2 会优先服从风格、牺牲身份。 这是工具硬上限，不是 prompt 没写好。规律：场景越华丽、人物越小，脸越容易跑。

身份锚点最先丢失——参考图最强的单一特征（本例＝蓝灰色眼睛）是判断锁脸成败的锚点。出图先看锚点有没有还原，不必逐项比对五官。锚点丢 = 锁脸失败。

三、可复用打法

0. prompt 开头必须显式禁止美化（GPT Image 2 默认会顺手美化导致跑脸）： keep her EXACT facial identity — same face shape, eyes, nose, lips, skin tone. Do not beautify or alter her features. 比例用自然语言（Vertical 2:3 portrait），不吃 --ar。

三级补救阶梯（按性价比排序）：

方案A 对话式微调（首选，最省事，本例从 85%→92%）： The face is not matching the reference photo. Regenerate with her EXACT face from the attached photo: [点名锚点，如 rounder face, larger blue-grey eyes, gentler expression]. Keep everything else (pose, scene, outfit) the same. 优势：只动脸不动景，是教科书级的”低损伤微调”。
方案B 拉近景别（成功率最高）：全身→半身/七分身，脸占比一上去锁脸立刻稳。代价：裁掉脚和下半场景。当核心卖点是”脸+氛围”时值得换。
方案C 两步合成（终极）：先单独出脸部特写确认锁脸 → 再融合氛围图。要求最高时用。

四、收尾铁律

锚点对上 + 气质对上 + 场景完整 = 可定稿。不要为修小瑕疵（如脚趾）重抽——重抽有脸再次跑偏的风险，见好就收。

五、与既有方法论的关系

与 微调的边界.md：本条是”脸占比”这一具体边界的工具实测补充。
与 双工具分工_nano锁脸+MJ摄影质感_v1.md：同属”单工具锁脸有上限 → 分工/分步绕过”的家族；GPT Image 2 在小脸占比下的上限，正是分步合成存在的理由。
待验证升格：下次任意图生图同人改绘复现”全身跑脸→对话拽回锚点”，即可升 ⭐⭐。