方法论与洞察

AI 形象图工作流分层 · niji5 + Nano · v2

入档:2026-05-15(v1)/ 升级 v2:2026-05-20 触发 v1:Prompt Battle 比赛冠军形象图项目(副会话 13 轮 niji 5 + 1 轮 Nano 后沉淀) 触发 v2:副会话 #4 涂图儿+良伞会话验证”Nano 也吃极简 prompt”——精密 prompt 反而压制 Nano 创造性 性质:跨项目通用工作流方法论 关联:MJ_niji5_行为档案_v2 / 方法论笔记_LLM-plan卡点工作流_v1 / Cowork协作的接口文件模式 / ../../复盘记录/复盘笔记_涂图儿良伞_悠船niji5_Nano极简_2026-05-20 / prompt极简化原则_v1


一句话

任何”画风强 + 个性化要素多”的 AI 形象图项目,都不可能用单一工具完成。强行让 niji 5 一次性出”画风对 + 漂浮对 + 颜值对 + 道具对 + 配色对”的图,就是踩工具物理上限——分层工作流(主体生成 + 后期精修)是唯一可行解。


二、为什么单一工具做不到

2.1 实测案例(冠军 #1 形象图)

副会话用 niji 5 试图”一次性出可用全身像”,耗了 13 轮 prompt 调试,仍然无法同时满足下面 4 项:

要求niji 5 能力矛盾
3D 渲染画风✅ 可(用 3D 渲染词堆叠触发)——
漂浮(脚不踩地)❌ 不可(任何”漂浮”词都切到二次元立绘分支)与画风冲突
颜值在线✅ 可(半身像加颜值锚定)但全身像下脸糊不可避免
黑红配色精准⚠️ 部分可(red accent 会被贪婪解读到鞋上)颜色失控

4 项约束 ≥ 2 项相互矛盾时,单一工具必然失败。继续在 niji 5 内迭代 = 看起来勤奋实际无效。

2.2 转折点

副会话耗到第 13 轮时,跳蛛先生从同事处获得新思路:

“用 Nano(Nano Banana / Gemini 图像编辑)做后期精修”

问题瞬间解决

这是工具能力边界的客观事实,不是 prompt 工程问题


三、分层工作流(终版)

3.1 三层架构

【Layer 1: niji 5 出主体】
  强项:画风、服装质感、整体构图、颜值锚定
  不强求:漂浮、特定道具、特定鞋款、精确配色位置
  轮次预期:3-4 轮(在工作流定型后)



【Layer 2: Nano 后期精修】
  强项:加道具、改局部、制造漂浮感、调动势、调配色
  轮次预期:1 轮(明确任务清单后)



【Layer 3: PS 微调(可选)】
  强项:印刷分辨率、局部颜色矫正、细节修正
  耗时预期:5-10 分钟

3.2 每一层的职责边界

Layer 1 · niji 5(主体生成) 应该负责:

不应该让 Layer 1 解决

Layer 2 · Nano(后期精修) 应该负责:

Layer 3 · PS(最终微调) 可选:


四、关键效率收益

工作流实际耗时备注
单一 niji 5 强求一次性出图13 轮 + 半天 + 个人精力大消耗冠军 #1 实测
分层工作流(niji 5 → Nano)3-4 轮 + 1 轮 Nano冠军 #2-5 预期

效率提升约 70%,更重要的是:


五、风格 DNA 反推陷阱(元方法论副产品)

副会话在做项目时,最初基于 10 张往期作品反推 style DNA,犯了 2 处误判:

误判实际规律
”几乎不直视镜头”❌ 实际有部分直视,侧脸只是占比偏多
”全部漂浮 / 不踩地”❌ 实际”漂浮”是少数派(~30%),站立/行走/裙摆吞脚才是主流

两个误判的共同陷阱:把”少数派特征”过度泛化成”全局风格”。

5.1 陷阱本质

反推 style DNA 时容易:

原因:人脑在归纳风格时,对”显著特征”的权重远超”实际占比”。漂浮看起来比站立”特别”,于是被记成”风格”。

5.2 解药

多轮确认 + 量化比例

  1. 第一次反推:列出每个维度的所有变体 + 占比(不要写”风格是 X”,要写”60% X + 30% Y + 10% Z”)
  2. 和用户确认:直接问”是否覆盖往期 80%+ 的作品”
  3. 被纠正后:重新分析具体哪几张是”主流”哪几张是”少数派”

5.3 本质 vs 表象

“不踩地”的本质是 不画地面/阴影/重心明显,不是必须真腾空。

可以用走路/侧身/裙摆吞脚等替代实现”本质”,不需要真的让 niji 5 出漂浮图(反正它做不到)。

这条对 prompt 工程的指导:识别用户描述的”表象需求”背后的”本质需求”——后者通常有更多实现路径。


六、副会话上手任务时的 4 个必问

副会话经过 13 轮试错沉淀出的第一原则

副会话接到任务时,不要立刻进入 prompt 工程,先问 4 个问题:

1. 这个项目是否有后期/精修工具可用?(Nano / PS / 其他)
   → 决定 niji 5 是否需要"做全部",决定工作流分层是否可能

2. 是否有时间压力?
   → 决定能否花时间做 style DNA 反推 vs 直接进入快速迭代

3. 服务对象的审美标准基线是什么?
   → 普通用户 vs 专业人士 vs 偶像级,决定颜值/细节投入度

4. 风格参考图是否包含完整尺寸要求?
   → 全身 / 半身 / 头肩,决定 niji 5 是否需要扩图工作流

第 1 个问题尤其重要——它解决了”工具能力 ≠ 项目能力”的最大盲点。


七、适用范围 · 跨项目通用

这条方法论不只适用于”niji 5 + Nano”,更广泛适用于任何”主体生成 + 后期精修”的工具组合:

7.1 已验证适用

7.2 推测适用(待验证)

7.3 元方法论的本质

不要逼一个工具做全部 是一条跨工具的元原则。每个 AI 工具都有物理上限:

识别每个工具的上限 + 用工作流分层突破 = AI 协作的核心元能力。


八、识别工具天花板的时机(关键判断)

什么时候应该停止在工具 A 内迭代,开始考虑工具 B 接管?

8.1 触发信号

8.2 不要做的(已验证)

8.3 应该做的


九、给跳蛛先生未来项目的指引

9.1 启动新项目前的 4 个确认

□ 1. 项目最终交付物是什么?(单张图 / 多张图 / 完整全身 / 半身)
□ 2. Layer 1 工具用什么?(niji 5 / MJ v8.1 / SD / 其他)
□ 3. Layer 2 后期工具是否可用?(Nano / PS / Photoshop AI / Krita)
□ 4. 是否有 style DNA 参考?如果有,规模?(5 张以下不可靠,10+ 张可反推)

9.2 副会话启动 brief 的标准模板更新

之前的 niji 5 共创者启动 brief(niji5人物形象图共创者_启动brief_2026-05-15.md)应该加一条:

第一步主动询问:项目是否有后期/精修工具可用(Nano / PS / 其他)? 如果有 → 明确分层职责(Layer 1 不强求做 Layer 2 能做的事) 如果没有 → 重新评估项目可行性,跨过工具上限的事项需要降低优先级或换工具


十、跨项目的”分层 / 协作 / 元能力”三联

这条方法论是更高阶元能力的一部分——

10.1 三联结构

维度方法论案例
工具分层本档案(niji 5 + Nano)Prompt Battle 形象图
协作分层Cowork协作的接口文件模式异界气象台 / 即时雨多主体协作
元能力识别(待沉淀)识别工具天花板的时机即时雨 LLM-plan + niji 5 形象图

10.2 三者的关系

完整的 AI 协作工作流 = 这三层共同生效


十一、风险与限制

11.1 分层工作流的成本

11.2 何时不适用


十二、Nano 极简 prompt 原则(🆕 v2)

入档:2026-05-20 触发:副会话 #4 良伞 + 文鳐鱼合成阶段——Claude 的”精密 Nano prompt”(遮挡关系/位置锚点/光影统一/反向禁止全堆上)跑不出来,跳蛛先生用 两步极简 prompt 直接出成片。 含义:v1 §三的”Layer 2: Nano 精修” 章节描述偏抽象(“靠后期工具做”),v2 把这条工作流的写法层面规律沉淀清楚。

12.1 实测案例:精密版 vs 极简版

Claude 之前写的”精密 Nano prompt”(失败)

跳蛛先生用的”极简 Nano prompt”(成功)

Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
        让 {{Image 2}} 中的形象漂浮在 {{Image 1}} 中的人物形象旁边,
        协调二者大小比例,
        同时保持画风的一致性和图片质量的一致性

Step 2: 让角色漂浮起来,注意保持风格一致性和图片质量

结果对比:极简版反而出了”文鳐鱼缩小成小神兽窝在良伞腰间” 的意外解,比 Claude 设计的”身后悬浮” 精密设计更动人。

12.2 深层规律:Nano 和 niji 5 是同款脾气

MJ_niji5_行为档案_v2 §坑 2 说过 niji 5 描述层 >10 词就过载,但当时只验证了 niji 5,没把这条迁移到 Nano。本次会话证明 Nano 也吃这一套

12.3 为什么精密 prompt 反而压制 Nano

维度精密 prompt极简 prompt
框死的范围所有位置/光影/边缘仅核心动作(融合/漂浮)
Nano 的发挥空间在框内挤压自由判断”协调”具体怎么实现
意外解概率低(被框死)高(“窝在腰间”、“缩小成小神兽” 等创造性合成)
用户工作量高(要写精确条款)低(写 3-4 句够了)

精密 prompt 是”防御性写作” —— Claude 想把所有可能出错的地方都堵死。但 Nano 这种合成模型的特点是”在弹性约束下的创造性判断”,防御性写作反而把创造性压制了

12.4 Nano 合成极简模板(推荐)

Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
        [核心关系描述,1-2 句],
        协调二者大小比例,
        同时保持画风的一致性和图片质量的一致性

Step 2(可选): [二次精修,1 句],
            注意保持风格一致性和图片质量

对比要点

12.5 操作流程(MVP 先行)

  1. 先写 3-4 句极简 prompt 尝试(MVP 原则)
  2. 跑出来看效果
  3. 如果方向对但某个维度偏了 → 加一句具体约束(仅针对那个维度)
  4. 如果方向完全跑偏 → 调整核心锚点,不要堆叠精密条款

反例:Claude 在涂图儿+良伞会话里直接用”精密版” 起手,跑不出来后继续加更多条款——这是把”防御性写作”误用在了创造性合成上。

12.6 与 prompt极简化原则_v1 的关系

prompt 极简化原则 之前在闪电战双场(MJ 上)验证。本次会话证明 Nano 也吃同一套 —— 这是跨工具验证,把”极简化” 从 MJ 限定方法论升格为生成式 AI 通用原则。

更上位的元规律:生成式 AI 工具的注意力机制对超长 prompt 的执行率随长度下降。这条规律已在以下工具上验证:

prompt极简化原则 应同步升级为 v1.1,加入 Nano 验证 + 跨工具结论。


十三、版本

升级触发:

继承链:


落款: 这条方法论的真正价值不在”如何用 niji 5 + Nano”—— 而在揭示了一条 AI 协作的元原则:每个工具都有物理上限,识别上限 + 跨工具分层是必备能力

跳蛛先生 5/15 同时在两个项目(即时雨音乐卡点 + Prompt Battle 形象图)撞同款元层失败——这是”识别工具天花板”这条元能力值得独立沉淀的最强信号。 等下个项目再撞一次,我会把”识别工具天花板的时机”作为独立元方法论入档。

类型/工作流方法论模型/niji5工具/Nano工具/Midjourney