AI 形象图工作流分层 · niji5 + Nano · v2
入档:2026-05-15(v1)/ 升级 v2:2026-05-20 触发 v1:Prompt Battle 比赛冠军形象图项目(副会话 13 轮 niji 5 + 1 轮 Nano 后沉淀) 触发 v2:副会话 #4 涂图儿+良伞会话验证”Nano 也吃极简 prompt”——精密 prompt 反而压制 Nano 创造性 性质:跨项目通用工作流方法论 关联:MJ_niji5_行为档案_v2 / 方法论笔记_LLM-plan卡点工作流_v1 / Cowork协作的接口文件模式 / ../../复盘记录/复盘笔记_涂图儿良伞_悠船niji5_Nano极简_2026-05-20 / prompt极简化原则_v1
一句话
任何”画风强 + 个性化要素多”的 AI 形象图项目,都不可能用单一工具完成。强行让 niji 5 一次性出”画风对 + 漂浮对 + 颜值对 + 道具对 + 配色对”的图,就是踩工具物理上限——分层工作流(主体生成 + 后期精修)是唯一可行解。
二、为什么单一工具做不到
2.1 实测案例(冠军 #1 形象图)
副会话用 niji 5 试图”一次性出可用全身像”,耗了 13 轮 prompt 调试,仍然无法同时满足下面 4 项:
| 要求 | niji 5 能力 | 矛盾 |
|---|---|---|
| 3D 渲染画风 | ✅ 可(用 3D 渲染词堆叠触发) | —— |
| 漂浮(脚不踩地) | ❌ 不可(任何”漂浮”词都切到二次元立绘分支) | 与画风冲突 |
| 颜值在线 | ✅ 可(半身像加颜值锚定) | 但全身像下脸糊不可避免 |
| 黑红配色精准 | ⚠️ 部分可(red accent 会被贪婪解读到鞋上) | 颜色失控 |
4 项约束 ≥ 2 项相互矛盾时,单一工具必然失败。继续在 niji 5 内迭代 = 看起来勤奋实际无效。
2.2 转折点
副会话耗到第 13 轮时,跳蛛先生从同事处获得新思路:
“用 Nano(Nano Banana / Gemini 图像编辑)做后期精修”
问题瞬间解决:
- niji 5 出主体(画风、服装、构图、颜值)—— 它最擅长的
- Nano 做精修(加麦克风、改靴款、制造漂浮、调动势)—— niji 5 物理上做不到的
这是工具能力边界的客观事实,不是 prompt 工程问题。
三、分层工作流(终版)
3.1 三层架构
【Layer 1: niji 5 出主体】
强项:画风、服装质感、整体构图、颜值锚定
不强求:漂浮、特定道具、特定鞋款、精确配色位置
轮次预期:3-4 轮(在工作流定型后)
↓
【Layer 2: Nano 后期精修】
强项:加道具、改局部、制造漂浮感、调动势、调配色
轮次预期:1 轮(明确任务清单后)
↓
【Layer 3: PS 微调(可选)】
强项:印刷分辨率、局部颜色矫正、细节修正
耗时预期:5-10 分钟
3.2 每一层的职责边界
Layer 1 · niji 5(主体生成) 应该负责:
- ✅ 画风(PBR 渲染感、布料褶皱、SSS 皮肤、金属高光)
- ✅ 主体描述(性别、发色、服装、年龄、表情)
- ✅ 构图(半身/全身、视角、对称性)
- ✅ 颜值锚定(半身像下)
不应该让 Layer 1 解决:
- ❌ 漂浮 / 不踩地 / 无阴影(physics 类约束)
- ❌ 特定道具的精确位置(麦克风、卡牌、剑)
- ❌ 鞋款的精确细节(战术靴 vs 骑士靴)
- ❌ 颜色 accent 的精确位置(红色在头发还是鞋)
- ❌ 头发动势的精确强度
Layer 2 · Nano(后期精修) 应该负责:
- ✅ 加道具:替换 / 添加手中物品
- ✅ 改鞋款 / 服装细节
- ✅ 制造漂浮感:脚部旋转 + 删除地面投影
- ✅ 增强动势:头发飘动 + 服装动感
- ✅ 强化特定颜色比例(如红色挑染加宽)
Layer 3 · PS(最终微调) 可选:
- ✅ 局部颜色矫正
- ✅ 印刷分辨率检查
- ✅ 缺陷点的最后修正
四、关键效率收益
| 工作流 | 实际耗时 | 备注 |
|---|---|---|
| 单一 niji 5 强求一次性出图 | 13 轮 + 半天 + 个人精力大消耗 | 冠军 #1 实测 |
| 分层工作流(niji 5 → Nano) | 3-4 轮 + 1 轮 Nano | 冠军 #2-5 预期 |
效率提升约 70%,更重要的是:
- ✅ 减少跳蛛先生精力消耗(13 轮试错对耐心是考验)
- ✅ 工作流可复用(5 位冠军用同一套模板,只换角色层)
- ✅ 风格统一性更高(同一套底层渲染参数 + 同一种后期处理)
五、风格 DNA 反推陷阱(元方法论副产品)
副会话在做项目时,最初基于 10 张往期作品反推 style DNA,犯了 2 处误判:
| 误判 | 实际规律 |
|---|---|
| ”几乎不直视镜头” | ❌ 实际有部分直视,侧脸只是占比偏多 |
| ”全部漂浮 / 不踩地” | ❌ 实际”漂浮”是少数派(~30%),站立/行走/裙摆吞脚才是主流 |
两个误判的共同陷阱:把”少数派特征”过度泛化成”全局风格”。
5.1 陷阱本质
反推 style DNA 时容易:
- 看到”3 张漂浮 + 7 张站立”,记成”全部漂浮”
- 看到”2 张侧脸 + 1 张直视 + 5 张俯视”,记成”几乎不直视”
原因:人脑在归纳风格时,对”显著特征”的权重远超”实际占比”。漂浮看起来比站立”特别”,于是被记成”风格”。
5.2 解药
多轮确认 + 量化比例:
- 第一次反推:列出每个维度的所有变体 + 占比(不要写”风格是 X”,要写”60% X + 30% Y + 10% Z”)
- 和用户确认:直接问”是否覆盖往期 80%+ 的作品”
- 被纠正后:重新分析具体哪几张是”主流”哪几张是”少数派”
5.3 本质 vs 表象
“不踩地”的本质是 不画地面/阴影/重心明显,不是必须真腾空。
- 表象层:“漂浮起来”
- 本质层:“没有地面 + 没有阴影 + 视觉重心不在脚上”
可以用走路/侧身/裙摆吞脚等替代实现”本质”,不需要真的让 niji 5 出漂浮图(反正它做不到)。
这条对 prompt 工程的指导:识别用户描述的”表象需求”背后的”本质需求”——后者通常有更多实现路径。
六、副会话上手任务时的 4 个必问
副会话经过 13 轮试错沉淀出的第一原则:
副会话接到任务时,不要立刻进入 prompt 工程,先问 4 个问题:
1. 这个项目是否有后期/精修工具可用?(Nano / PS / 其他)
→ 决定 niji 5 是否需要"做全部",决定工作流分层是否可能
2. 是否有时间压力?
→ 决定能否花时间做 style DNA 反推 vs 直接进入快速迭代
3. 服务对象的审美标准基线是什么?
→ 普通用户 vs 专业人士 vs 偶像级,决定颜值/细节投入度
4. 风格参考图是否包含完整尺寸要求?
→ 全身 / 半身 / 头肩,决定 niji 5 是否需要扩图工作流
第 1 个问题尤其重要——它解决了”工具能力 ≠ 项目能力”的最大盲点。
七、适用范围 · 跨项目通用
这条方法论不只适用于”niji 5 + Nano”,更广泛适用于任何”主体生成 + 后期精修”的工具组合:
7.1 已验证适用
- ✅ niji 5 + Nano:Prompt Battle 冠军形象图(本案例)
- ✅ PIL + Nano:《即时雨》MV 封面(同期同日案例,跳蛛先生最终采用同好的 Nano 重构)
7.2 推测适用(待验证)
- 🔄 MJ v8.1 + Nano:游戏角色立绘
- 🔄 MJ v7 + oref + Nano:IP 系列形象(角色一致性 + 后期精修)
- 🔄 Suno + 剪映 + Code 工具:音乐 MV 制作(实际即时雨已经走这条工作流)
- 🔄 Whisper + LLM + MoviePy:视频卡点(即时雨案例已验证)
- 🔄 Stable Diffusion + ControlNet + PS:批量人物形象(控制 + 精修分层)
7.3 元方法论的本质
不要逼一个工具做全部 是一条跨工具的元原则。每个 AI 工具都有物理上限:
- niji 5 的上限是”漂浮 + 多约束 + 高颜值”同时成立
- MJ V8.1 的上限是”角色一致性 + 美学最大化”同时成立
- LLM 的上限是”语义层判断 + 精确时序计算”同时成立
识别每个工具的上限 + 用工作流分层突破 = AI 协作的核心元能力。
八、识别工具天花板的时机(关键判断)
什么时候应该停止在工具 A 内迭代,开始考虑工具 B 接管?
8.1 触发信号
- 🚨 连续 3 轮 prompt 调整后无明显提升
- 🚨 同一个错误重复出现(如
red accent100% 落鞋,刷再多轮都不变) - 🚨 新增一个约束就破坏另一个约束(描述层过载)
- 🚨 你开始说”再试一下运气” —— 这是最隐蔽的信号,是”看起来勤奋实际无效”的入口
8.2 不要做的(已验证)
- ❌ 在工具内”再刷几轮看运气”——12 张里只撞到 1-2 张例外,统计学上不会再有更好结果
- ❌ 假设”是 prompt 不够好” —— 当工具有物理上限时,无论 prompt 多巧妙都跨不过
- ❌ 不主动问”是否有后期工具” —— 这是副会话最深的教训
8.3 应该做的
- ✅ 主动询问用户”是否有 Layer 2 / Layer 3 工具可用”
- ✅ 如果没有 → 重新评估项目可行性,告知用户”工具上限决定项目上限”
- ✅ 如果有 → 立刻切到分层工作流,定义每一层的职责
九、给跳蛛先生未来项目的指引
9.1 启动新项目前的 4 个确认
□ 1. 项目最终交付物是什么?(单张图 / 多张图 / 完整全身 / 半身)
□ 2. Layer 1 工具用什么?(niji 5 / MJ v8.1 / SD / 其他)
□ 3. Layer 2 后期工具是否可用?(Nano / PS / Photoshop AI / Krita)
□ 4. 是否有 style DNA 参考?如果有,规模?(5 张以下不可靠,10+ 张可反推)
9.2 副会话启动 brief 的标准模板更新
之前的 niji 5 共创者启动 brief(niji5人物形象图共创者_启动brief_2026-05-15.md)应该加一条:
第一步主动询问:项目是否有后期/精修工具可用(Nano / PS / 其他)? 如果有 → 明确分层职责(Layer 1 不强求做 Layer 2 能做的事) 如果没有 → 重新评估项目可行性,跨过工具上限的事项需要降低优先级或换工具
十、跨项目的”分层 / 协作 / 元能力”三联
这条方法论是更高阶元能力的一部分——
10.1 三联结构
| 维度 | 方法论 | 案例 |
|---|---|---|
| 工具分层 | 本档案(niji 5 + Nano) | Prompt Battle 形象图 |
| 协作分层 | Cowork协作的接口文件模式 | 异界气象台 / 即时雨多主体协作 |
| 元能力识别 | (待沉淀)识别工具天花板的时机 | 即时雨 LLM-plan + niji 5 形象图 |
10.2 三者的关系
- 工具分层 = 物理层(不同工具做不同事)
- 协作分层 = 流程层(不同主体在接口文件上协作)
- 元能力识别 = 决策层(什么时候切到分层)
完整的 AI 协作工作流 = 这三层共同生效。
十一、风险与限制
11.1 分层工作流的成本
- ⚠️ 学习成本:用户需要同时掌握 Layer 1(如 niji 5)+ Layer 2(如 Nano)两套工具
- ⚠️ 接口成本:Layer 1 → Layer 2 的中间产物(如 niji 5 出图)需要妥善保存
- ⚠️ 沟通成本:副会话需要把”Layer 2 任务清单”清晰传递给用户
11.2 何时不适用
- ❌ 单张图项目(一次性需求,不值得搭建分层工作流)
- ❌ 用户没有 Layer 2 工具且无法获取(如某些封闭环境)
- ❌ 极快交付项目(< 30 分钟,分层切换成本反而高)
十二、Nano 极简 prompt 原则(🆕 v2)
入档:2026-05-20 触发:副会话 #4 良伞 + 文鳐鱼合成阶段——Claude 的”精密 Nano prompt”(遮挡关系/位置锚点/光影统一/反向禁止全堆上)跑不出来,跳蛛先生用 两步极简 prompt 直接出成片。 含义:v1 §三的”Layer 2: Nano 精修” 章节描述偏抽象(“靠后期工具做”),v2 把这条工作流的写法层面规律沉淀清楚。
12.1 实测案例:精密版 vs 极简版
Claude 之前写的”精密 Nano prompt”(失败):
- 框死遮挡关系
- 锁定位置坐标
- 锁定光影方向 / 边缘融合等技术参数
- 写”严格保留 X / 不要 Y / Z 完全不变” 等条款式约束
跳蛛先生用的”极简 Nano prompt”(成功):
Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
让 {{Image 2}} 中的形象漂浮在 {{Image 1}} 中的人物形象旁边,
协调二者大小比例,
同时保持画风的一致性和图片质量的一致性
Step 2: 让角色漂浮起来,注意保持风格一致性和图片质量
结果对比:极简版反而出了”文鳐鱼缩小成小神兽窝在良伞腰间” 的意外解,比 Claude 设计的”身后悬浮” 精密设计更动人。
12.2 深层规律:Nano 和 niji 5 是同款脾气
MJ_niji5_行为档案_v2 §坑 2 说过 niji 5 描述层 >10 词就过载,但当时只验证了 niji 5,没把这条迁移到 Nano。本次会话证明 Nano 也吃这一套:
- 核心锚点 3-4 个
- 配上”保持一致性” 这种弹性约束
- 不写”严格保留 / 不要做 / 反向禁止” 这些条款式约束
12.3 为什么精密 prompt 反而压制 Nano
| 维度 | 精密 prompt | 极简 prompt |
|---|---|---|
| 框死的范围 | 所有位置/光影/边缘 | 仅核心动作(融合/漂浮) |
| Nano 的发挥空间 | 在框内挤压 | 自由判断”协调”具体怎么实现 |
| 意外解概率 | 低(被框死) | 高(“窝在腰间”、“缩小成小神兽” 等创造性合成) |
| 用户工作量 | 高(要写精确条款) | 低(写 3-4 句够了) |
精密 prompt 是”防御性写作” —— Claude 想把所有可能出错的地方都堵死。但 Nano 这种合成模型的特点是”在弹性约束下的创造性判断”,防御性写作反而把创造性压制了。
12.4 Nano 合成极简模板(推荐)
Step 1: 把 {{Image 1}} {{Image 2}} 融合进一张图,
[核心关系描述,1-2 句],
协调二者大小比例,
同时保持画风的一致性和图片质量的一致性
Step 2(可选): [二次精修,1 句],
注意保持风格一致性和图片质量
对比要点:
- ❌ 不要写”严格保留 / 不要做 / 反向禁止”
- ❌ 不要锁定具体位置坐标(让 Nano 自己判断”协调”)
- ❌ 不要写光影方向 / 遮挡关系 / 边缘融合等技术参数
- ✅ 只写”做什么”(融合+漂浮)+ “保持什么”(画风/质量)
12.5 操作流程(MVP 先行)
- 先写 3-4 句极简 prompt 尝试(MVP 原则)
- 跑出来看效果
- 如果方向对但某个维度偏了 → 加一句具体约束(仅针对那个维度)
- 如果方向完全跑偏 → 调整核心锚点,不要堆叠精密条款
反例:Claude 在涂图儿+良伞会话里直接用”精密版” 起手,跑不出来后继续加更多条款——这是把”防御性写作”误用在了创造性合成上。
12.6 与 prompt极简化原则_v1 的关系
prompt 极简化原则 之前在闪电战双场(MJ 上)验证。本次会话证明 Nano 也吃同一套 —— 这是跨工具验证,把”极简化” 从 MJ 限定方法论升格为生成式 AI 通用原则。
更上位的元规律:生成式 AI 工具的注意力机制对超长 prompt 的执行率随长度下降。这条规律已在以下工具上验证:
- ✅ MJ V7 / niji 5(prompt极简化原则_v1 §双场验证)
- ✅ Nano(本档案 §十二,🆕 v2)
- ✅ Suno v5.5(Suno_v5.5_行为规律 经验 5 反向版本——重要指令要重复,次要指令砍掉)
prompt极简化原则 应同步升级为 v1.1,加入 Nano 验证 + 跨工具结论。
十三、版本
- v1 - 2026-05-15 - 主对话 Claude 沉淀(基于副会话 niji 5 共创者 1 个冠军案例)
- v2 - 2026-05-20 - 主对话 Claude(第二任)升级(基于副会话 #4 涂图儿+良伞会话,加 §十二 Nano 极简 prompt 原则 + 与悠船 niji 5 实测的工作流影响)
升级触发:
- ✅ v2:第二个项目(涂图儿+良伞)验证了”Nano 也吃极简”
- 第三个项目验证 Nano 极简后,§十二 可独立成档为 Nano_合成prompt原则_v1
- 跨工具验证(SD inpaint / 即梦 inpaint 等)后,§十二 升格为通用图像合成原则
继承链:
- 原始材料:副会话
项目阶段性回执_运营经理_2026-05-15.md+复盘笔记_冠军1_prompt_battle形象图_2026-05-15.md - 配套档案:MJ_niji5_行为档案_v2
- 同期同类元方法论:方法论笔记_LLM-plan卡点工作流_v1(即时雨案例)
落款: 这条方法论的真正价值不在”如何用 niji 5 + Nano”—— 而在揭示了一条 AI 协作的元原则:每个工具都有物理上限,识别上限 + 跨工具分层是必备能力。
跳蛛先生 5/15 同时在两个项目(即时雨音乐卡点 + Prompt Battle 形象图)撞同款元层失败——这是”识别工具天花板”这条元能力值得独立沉淀的最强信号。 等下个项目再撞一次,我会把”识别工具天花板的时机”作为独立元方法论入档。