方法论与洞察

AI 形象图工作流分层 · niji5 + Nano · v2

入档：2026-05-15（v1）/ 升级 v2：2026-05-20 触发 v1：Prompt Battle 比赛冠军形象图项目（副会话 13 轮 niji 5 + 1 轮 Nano 后沉淀）触发 v2：副会话 #4 涂图儿+良伞会话验证”Nano 也吃极简 prompt”——精密 prompt 反而压制 Nano 创造性性质：跨项目通用工作流方法论关联：MJ_niji5_行为档案_v2 / 方法论笔记_LLM-plan卡点工作流_v1 / Cowork协作的接口文件模式 / ../../复盘记录/复盘笔记_涂图儿良伞_悠船niji5_Nano极简_2026-05-20 / prompt极简化原则_v1

一句话

任何”画风强 + 个性化要素多”的 AI 形象图项目，都不可能用单一工具完成。强行让 niji 5 一次性出”画风对 + 漂浮对 + 颜值对 + 道具对 + 配色对”的图，就是踩工具物理上限——分层工作流（主体生成 + 后期精修）是唯一可行解。

二、为什么单一工具做不到

2.1 实测案例（冠军 #1 形象图）

副会话用 niji 5 试图”一次性出可用全身像”，耗了 13 轮 prompt 调试，仍然无法同时满足下面 4 项：

要求	niji 5 能力	矛盾
3D 渲染画风	✅ 可（用 3D 渲染词堆叠触发）	——
漂浮（脚不踩地）	❌ 不可（任何”漂浮”词都切到二次元立绘分支）	与画风冲突
颜值在线	✅ 可（半身像加颜值锚定）	但全身像下脸糊不可避免
黑红配色精准	⚠️ 部分可（`red accent` 会被贪婪解读到鞋上）	颜色失控

4 项约束 ≥ 2 项相互矛盾时，单一工具必然失败。继续在 niji 5 内迭代 = 看起来勤奋实际无效。

2.2 转折点

副会话耗到第 13 轮时，跳蛛先生从同事处获得新思路：

“用 Nano（Nano Banana / Gemini 图像编辑）做后期精修”

问题瞬间解决：

niji 5 出主体（画风、服装、构图、颜值）—— 它最擅长的
Nano 做精修（加麦克风、改靴款、制造漂浮、调动势）—— niji 5 物理上做不到的

这是工具能力边界的客观事实，不是 prompt 工程问题。

三、分层工作流（终版）

3.1 三层架构

【Layer 1: niji 5 出主体】
  强项：画风、服装质感、整体构图、颜值锚定
  不强求：漂浮、特定道具、特定鞋款、精确配色位置
  轮次预期：3-4 轮（在工作流定型后）

         ↓

【Layer 2: Nano 后期精修】
  强项：加道具、改局部、制造漂浮感、调动势、调配色
  轮次预期：1 轮（明确任务清单后）

         ↓

【Layer 3: PS 微调（可选）】
  强项：印刷分辨率、局部颜色矫正、细节修正
  耗时预期：5-10 分钟

3.2 每一层的职责边界

Layer 1 · niji 5（主体生成） 应该负责：

✅ 画风（PBR 渲染感、布料褶皱、SSS 皮肤、金属高光）
✅ 主体描述（性别、发色、服装、年龄、表情）
✅ 构图（半身/全身、视角、对称性）
✅ 颜值锚定（半身像下）

不应该让 Layer 1 解决：

❌ 漂浮 / 不踩地 / 无阴影（physics 类约束）
❌ 特定道具的精确位置（麦克风、卡牌、剑）
❌ 鞋款的精确细节（战术靴 vs 骑士靴）
❌ 颜色 accent 的精确位置（红色在头发还是鞋）
❌ 头发动势的精确强度

Layer 2 · Nano（后期精修） 应该负责：

✅ 加道具：替换 / 添加手中物品
✅ 改鞋款 / 服装细节
✅ 制造漂浮感：脚部旋转 + 删除地面投影
✅ 增强动势：头发飘动 + 服装动感
✅ 强化特定颜色比例（如红色挑染加宽）

Layer 3 · PS（最终微调） 可选：

✅ 局部颜色矫正
✅ 印刷分辨率检查
✅ 缺陷点的最后修正

四、关键效率收益

工作流	实际耗时	备注
单一 niji 5 强求一次性出图	13 轮 + 半天 + 个人精力大消耗	冠军 #1 实测
分层工作流（niji 5 → Nano）	3-4 轮 + 1 轮 Nano	冠军 #2-5 预期

效率提升约 70%，更重要的是：

✅ 减少跳蛛先生精力消耗（13 轮试错对耐心是考验）
✅ 工作流可复用（5 位冠军用同一套模板，只换角色层）
✅ 风格统一性更高（同一套底层渲染参数 + 同一种后期处理）

五、风格 DNA 反推陷阱（元方法论副产品）

副会话在做项目时，最初基于 10 张往期作品反推 style DNA，犯了 2 处误判：

误判	实际规律
”几乎不直视镜头”	❌ 实际有部分直视，侧脸只是占比偏多
”全部漂浮 / 不踩地”	❌ 实际”漂浮”是少数派（~30%），站立/行走/裙摆吞脚才是主流

两个误判的共同陷阱：把”少数派特征”过度泛化成”全局风格”。

5.1 陷阱本质

反推 style DNA 时容易：

看到”3 张漂浮 + 7 张站立”，记成”全部漂浮”
看到”2 张侧脸 + 1 张直视 + 5 张俯视”，记成”几乎不直视”

原因：人脑在归纳风格时，对”显著特征”的权重远超”实际占比”。漂浮看起来比站立”特别”，于是被记成”风格”。

5.2 解药

多轮确认 + 量化比例：

第一次反推：列出每个维度的所有变体 + 占比（不要写”风格是 X”，要写”60% X + 30% Y + 10% Z”）
和用户确认：直接问”是否覆盖往期 80%+ 的作品”
被纠正后：重新分析具体哪几张是”主流”哪几张是”少数派”

5.3 本质 vs 表象

“不踩地”的本质是 不画地面/阴影/重心明显，不是必须真腾空。

表象层：“漂浮起来”
本质层：“没有地面 + 没有阴影 + 视觉重心不在脚上”

可以用走路/侧身/裙摆吞脚等替代实现”本质”，不需要真的让 niji 5 出漂浮图（反正它做不到）。

这条对 prompt 工程的指导：识别用户描述的”表象需求”背后的”本质需求”——后者通常有更多实现路径。

六、副会话上手任务时的 4 个必问

副会话经过 13 轮试错沉淀出的第一原则：

副会话接到任务时，不要立刻进入 prompt 工程，先问 4 个问题：

1. 这个项目是否有后期/精修工具可用？（Nano / PS / 其他）
   → 决定 niji 5 是否需要"做全部"，决定工作流分层是否可能

2. 是否有时间压力？
   → 决定能否花时间做 style DNA 反推 vs 直接进入快速迭代

3. 服务对象的审美标准基线是什么？
   → 普通用户 vs 专业人士 vs 偶像级，决定颜值/细节投入度

4. 风格参考图是否包含完整尺寸要求？
   → 全身 / 半身 / 头肩，决定 niji 5 是否需要扩图工作流

第 1 个问题尤其重要——它解决了”工具能力 ≠ 项目能力”的最大盲点。

七、适用范围 · 跨项目通用

这条方法论不只适用于”niji 5 + Nano”，更广泛适用于任何”主体生成 + 后期精修”的工具组合：

7.1 已验证适用

✅ niji 5 + Nano：Prompt Battle 冠军形象图（本案例）
✅ PIL + Nano：《即时雨》MV 封面（同期同日案例，跳蛛先生最终采用同好的 Nano 重构）

7.2 推测适用（待验证）

🔄 MJ v8.1 + Nano：游戏角色立绘
🔄 MJ v7 + oref + Nano：IP 系列形象（角色一致性 + 后期精修）
🔄 Suno + 剪映 + Code 工具：音乐 MV 制作（实际即时雨已经走这条工作流）
🔄 Whisper + LLM + MoviePy：视频卡点（即时雨案例已验证）
🔄 Stable Diffusion + ControlNet + PS：批量人物形象（控制 + 精修分层）

7.3 元方法论的本质

不要逼一个工具做全部 是一条跨工具的元原则。每个 AI 工具都有物理上限：

niji 5 的上限是”漂浮 + 多约束 + 高颜值”同时成立
MJ V8.1 的上限是”角色一致性 + 美学最大化”同时成立
LLM 的上限是”语义层判断 + 精确时序计算”同时成立

识别每个工具的上限 + 用工作流分层突破 = AI 协作的核心元能力。

八、识别工具天花板的时机（关键判断）

什么时候应该停止在工具 A 内迭代，开始考虑工具 B 接管？

8.1 触发信号

🚨 连续 3 轮 prompt 调整后无明显提升
🚨 同一个错误重复出现（如 red accent 100% 落鞋，刷再多轮都不变）
🚨 新增一个约束就破坏另一个约束（描述层过载）
🚨 你开始说”再试一下运气” —— 这是最隐蔽的信号，是”看起来勤奋实际无效”的入口

8.2 不要做的（已验证）

❌ 在工具内”再刷几轮看运气”——12 张里只撞到 1-2 张例外，统计学上不会再有更好结果
❌ 假设”是 prompt 不够好” —— 当工具有物理上限时，无论 prompt 多巧妙都跨不过
❌ 不主动问”是否有后期工具” —— 这是副会话最深的教训

8.3 应该做的

✅ 主动询问用户”是否有 Layer 2 / Layer 3 工具可用”
✅ 如果没有 → 重新评估项目可行性，告知用户”工具上限决定项目上限”
✅ 如果有 → 立刻切到分层工作流，定义每一层的职责

九、给跳蛛先生未来项目的指引

9.1 启动新项目前的 4 个确认

□ 1. 项目最终交付物是什么？（单张图 / 多张图 / 完整全身 / 半身）
□ 2. Layer 1 工具用什么？（niji 5 / MJ v8.1 / SD / 其他）
□ 3. Layer 2 后期工具是否可用？（Nano / PS / Photoshop AI / Krita）
□ 4. 是否有 style DNA 参考？如果有，规模？（5 张以下不可靠，10+ 张可反推）

9.2 副会话启动 brief 的标准模板更新

之前的 niji 5 共创者启动 brief（niji5人物形象图共创者_启动brief_2026-05-15.md）应该加一条：

第一步主动询问：项目是否有后期/精修工具可用（Nano / PS / 其他）？ 如果有 → 明确分层职责（Layer 1 不强求做 Layer 2 能做的事）如果没有 → 重新评估项目可行性，跨过工具上限的事项需要降低优先级或换工具

十、跨项目的”分层 / 协作 / 元能力”三联

这条方法论是更高阶元能力的一部分——

10.1 三联结构

维度	方法论	案例
工具分层	本档案（niji 5 + Nano）	Prompt Battle 形象图
协作分层	Cowork协作的接口文件模式	异界气象台 / 即时雨多主体协作
元能力识别	（待沉淀）识别工具天花板的时机	即时雨 LLM-plan + niji 5 形象图

10.2 三者的关系

工具分层 = 物理层（不同工具做不同事）
协作分层 = 流程层（不同主体在接口文件上协作）
元能力识别 = 决策层（什么时候切到分层）

完整的 AI 协作工作流 = 这三层共同生效。

十一、风险与限制

11.1 分层工作流的成本

⚠️ 学习成本：用户需要同时掌握 Layer 1（如 niji 5）+ Layer 2（如 Nano）两套工具
⚠️ 接口成本：Layer 1 → Layer 2 的中间产物（如 niji 5 出图）需要妥善保存
⚠️ 沟通成本：副会话需要把”Layer 2 任务清单”清晰传递给用户

11.2 何时不适用

❌ 单张图项目（一次性需求，不值得搭建分层工作流）
❌ 用户没有 Layer 2 工具且无法获取（如某些封闭环境）
❌ 极快交付项目（< 30 分钟，分层切换成本反而高）

十二、Nano 极简 prompt 原则（🆕 v2）

入档：2026-05-20 触发：副会话 #4 良伞 + 文鳐鱼合成阶段——Claude 的”精密 Nano prompt”（遮挡关系/位置锚点/光影统一/反向禁止全堆上）跑不出来，跳蛛先生用 两步极简 prompt 直接出成片。含义：v1 §三的”Layer 2: Nano 精修” 章节描述偏抽象（“靠后期工具做”），v2 把这条工作流的写法层面规律沉淀清楚。

12.1 实测案例：精密版 vs 极简版

Claude 之前写的”精密 Nano prompt”（失败）：

框死遮挡关系
锁定位置坐标
锁定光影方向 / 边缘融合等技术参数
写”严格保留 X / 不要 Y / Z 完全不变” 等条款式约束

跳蛛先生用的”极简 Nano prompt”（成功）：

Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
        让 {{Image 2}} 中的形象漂浮在 {{Image 1}} 中的人物形象旁边,
        协调二者大小比例,
        同时保持画风的一致性和图片质量的一致性

Step 2: 让角色漂浮起来,注意保持风格一致性和图片质量

结果对比：极简版反而出了”文鳐鱼缩小成小神兽窝在良伞腰间” 的意外解，比 Claude 设计的”身后悬浮” 精密设计更动人。

12.2 深层规律：Nano 和 niji 5 是同款脾气

MJ_niji5_行为档案_v2 §坑 2 说过 niji 5 描述层 >10 词就过载，但当时只验证了 niji 5，没把这条迁移到 Nano。本次会话证明 Nano 也吃这一套：

核心锚点 3-4 个
配上”保持一致性” 这种弹性约束
不写”严格保留 / 不要做 / 反向禁止” 这些条款式约束

12.3 为什么精密 prompt 反而压制 Nano

维度	精密 prompt	极简 prompt
框死的范围	所有位置/光影/边缘	仅核心动作（融合/漂浮）
Nano 的发挥空间	在框内挤压	自由判断”协调”具体怎么实现
意外解概率	低（被框死）	高（“窝在腰间”、“缩小成小神兽” 等创造性合成）
用户工作量	高（要写精确条款）	低（写 3-4 句够了）

精密 prompt 是”防御性写作” —— Claude 想把所有可能出错的地方都堵死。但 Nano 这种合成模型的特点是”在弹性约束下的创造性判断”，防御性写作反而把创造性压制了。

12.4 Nano 合成极简模板（推荐）

Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
        [核心关系描述,1-2 句],
        协调二者大小比例,
        同时保持画风的一致性和图片质量的一致性

Step 2(可选): [二次精修,1 句],
            注意保持风格一致性和图片质量

对比要点：

❌ 不要写”严格保留 / 不要做 / 反向禁止”
❌ 不要锁定具体位置坐标（让 Nano 自己判断”协调”）
❌ 不要写光影方向 / 遮挡关系 / 边缘融合等技术参数
✅ 只写”做什么”（融合+漂浮）+ “保持什么”（画风/质量）

12.5 操作流程（MVP 先行）

先写 3-4 句极简 prompt 尝试（MVP 原则）
跑出来看效果
如果方向对但某个维度偏了 → 加一句具体约束（仅针对那个维度）
如果方向完全跑偏 → 调整核心锚点，不要堆叠精密条款

反例：Claude 在涂图儿+良伞会话里直接用”精密版” 起手，跑不出来后继续加更多条款——这是把”防御性写作”误用在了创造性合成上。

12.6 与 prompt极简化原则_v1 的关系

prompt 极简化原则 之前在闪电战双场（MJ 上）验证。本次会话证明 Nano 也吃同一套 —— 这是跨工具验证，把”极简化” 从 MJ 限定方法论升格为生成式 AI 通用原则。

更上位的元规律：生成式 AI 工具的注意力机制对超长 prompt 的执行率随长度下降。这条规律已在以下工具上验证：

✅ MJ V7 / niji 5（prompt极简化原则_v1 §双场验证）
✅ Nano（本档案 §十二，🆕 v2）
✅ Suno v5.5（Suno_v5.5_行为规律经验 5 反向版本——重要指令要重复，次要指令砍掉）

prompt极简化原则应同步升级为 v1.1，加入 Nano 验证 + 跨工具结论。

十三、版本

v1 - 2026-05-15 - 主对话 Claude 沉淀（基于副会话 niji 5 共创者 1 个冠军案例）
v2 - 2026-05-20 - 主对话 Claude（第二任）升级（基于副会话 #4 涂图儿+良伞会话，加 §十二 Nano 极简 prompt 原则 + 与悠船 niji 5 实测的工作流影响）

升级触发：

✅ v2：第二个项目（涂图儿+良伞）验证了”Nano 也吃极简”
第三个项目验证 Nano 极简后，§十二可独立成档为 Nano_合成prompt原则_v1
跨工具验证（SD inpaint / 即梦 inpaint 等）后，§十二升格为通用图像合成原则

继承链：

原始材料：副会话 项目阶段性回执_运营经理_2026-05-15.md + 复盘笔记_冠军1_prompt_battle形象图_2026-05-15.md
配套档案：MJ_niji5_行为档案_v2
同期同类元方法论：方法论笔记_LLM-plan卡点工作流_v1（即时雨案例）

落款：这条方法论的真正价值不在”如何用 niji 5 + Nano”—— 而在揭示了一条 AI 协作的元原则：每个工具都有物理上限，识别上限 + 跨工具分层是必备能力。

跳蛛先生 5/15 同时在两个项目（即时雨音乐卡点 + Prompt Battle 形象图）撞同款元层失败——这是”识别工具天花板”这条元能力值得独立沉淀的最强信号。等下个项目再撞一次，我会把”识别工具天花板的时机”作为独立元方法论入档。

类型/工作流方法论模型/niji5工具/Nano工具/Midjourney