参数行为档案

MJ v8.1 无 oref/cref · 混合工作流

入档:2026-05-12(D2 晚间) 触发:「拾色」女主形象试跑时,需要在 v8.1 美学和角色一致性之间做 trade-off 关联:角色一致性金字塔


一句话

v8.1 美学优于 v7,但 v8.1 没有 cref/oref 功能。 解法不是二选一,是按镜头需要分工


如何使用

写一支多镜头作品(MV / 海报组 / 系列封面)前,先把所有镜头按”是否需要清晰看到她的脸”分成 A/B/C 三类

类别定义工具
A · 必须锁脸脸是主体(特写 / 半身正面 / 看表情)v7 + oref —ow 100
B · 半锁脸半身侧背 / 远景轮廓v7 + oref —ow 50-70
C · 无需锁脸道具 / 局部 / 场景 / 远景 / 手部 / 黑场v8.1(美学最大化 + 无 reference)

典型分布:16 镜作品里 A 类约 25% / B 类约 25% / C 类约 50%。

C 类占一半 → 整片综合美学接近 v8.1 全片,只有”她的脸”的镜头损失 v7 的美学差。


v7 vs v8.1 实测对比(拾色 D2)

v8.1 出图特点

v8.1 inset frame 双层结构稳定执行(2026-05-14 实测)

发现来源:异界气象台 minitest 第一节·深海第七断层 prompt 测试(A-v3 组)

prompt 写入:

... ultra wide top-down satellite view of an unknown ocean region as the main image, a smaller inset square frame in the upper right corner showing a cross-section diagram of an underwater trench ...

结果:MJ V8.1 在 4 张抽卡中全部稳定召出”主图 + 右上角子图”的标准排版——主图是俯瞰场景,子图小窗口里是 cross-section / radar scan / topographic 等技术示意图。

关键能力

应用场景

注意事项


v8.1 inset frame 子图内容偏离 prompt 的常见模式(2026-05-14 实测追加)

第一节验证过双层叠加(inset frame)100% 稳定召出,但子图具体内容的执行有偏差:

prompt 写实际跑出
cross-section diagram of an underwater trench✅ 较准确(剖面图)
radar scan view with grid scale✅ 准确(带刻度的雷达扫描)
thermal radar visualization with cold color heat map⚠️ 偏离 —— 出”温度热点 / 异常事件型景观”,不是”等温线图”
geological topographic chart(未测试)

规律推测:MJ 训练数据里 “radar” / “cross-section” 等”二维可视化技术”图示丰富,但 “thermal heat map” 这类”色彩映射数据可视化”训练样本较少,倾向用”光点 / 红色热区”代替等温线。

应对:想要”等温线图”风格,prompt 写得更直接:topographic isotherm contour map with concentric temperature rings 而非 thermal heat map

但子图偏离不一定是坏事——异界气象台第三节 A-v2_u0 跑出的”红色温度热点”反而和字幕”-89℃ 温度回升”互锁,是 happy accident。


v8.1 材质属性形容词弱权重(2026-05-14 实测)

prompt 写:

snowflakes have a faint metallic sheen catching the dim ambient light

期望:雪花有金属光泽(暗示”金属味的雪”诗意)。

实际:4 张抽卡全部跑出普通雾雪,没有任何金属感。

规律:MJ V8.1 对”具体材质属性形容词”(metallic sheen / glossy / wet / translucent / iridescent 作为形容词修饰名词时)执行不稳定——它把这些当弱权重 modifier 处理,优先级低于主体形态描述。

应对:把材质属性做成视觉元素本身

❌ 弱(形容词模式)✅ 强(视觉元素模式)
snowflakes with metallic sheentiny metallic silver shards mixed with snow particles
glossy black armorpitch black armor reflecting bright highlights
wet skinskin with visible water droplets on the surface
iridescent feathersfeathers with rainbow color gradient like oil on water

v8.1 数量约束 “single / one” 执行不稳定(2026-05-14 实测)

prompt 写:

a single tall thin mechanical figure silhouette barely visible

实际:4 张抽卡里有 2 张跑出了 2-3 个剪影,“single” 数量约束执行率约 50%。

规律:MJ 对”数量词”的执行受 prompt 整体语境干扰。如果 prompt 后续描述了”scattered” / “in the distance” 等空间分布词,“single” 会被忽略。

应对:双重约束 + 强否定:

注意:本节恰好需要”几个剪影”而非”一个”(brief 要求”几个机械生命体的剪影”),所以这次的”数量约束失败”反而符合 brief。是否需要严格 single 看具体需求


v8.1 “closing transmission/shot” 自动召出 letterbox + 双频道结构(2026-05-14 实测)

发现来源:异界气象台 minitest 收尾·总览图 v2/v3 测试

问题:v3 prompt 没写 letterbox,但 4 张全部跑出了 letterbox + 双弧线结构;v2 prompt 写了 prominent black letterbox bars,但跑出的 4 张里 3 张是双 letterbox 双弧线而非期望的”单 letterbox 单弧线”。

规律:MJ V8.1 把 closing transmission / closing shot 关联到了**“电视信号即将关机的双频道残影 / 录像带切换瞬间”**——这是训练数据里电视档案影像的典型视觉特征。

应用调整


v8.1 双重约束尺寸技巧:稳定锁标记点大小(2026-05-14 实测)

发现来源:异界气象台 minitest 收尾·总览图 12 张抽卡

正例:prompt 写

three small bright white circular markers ... about 2 percent of the frame width each

12 张全部稳定召出清晰、大小合适的白色圆点——MJ 把”形容词(small bright)+ 量化(about 2%)“作为强双重约束执行。

模板

对比反例:第三节 prompt 写 tiny dark dots barely visible——只用形容词,MJ 把”废墟”画得比 prompt 要求更显眼。

回流到”材质属性形容词弱权重”小节作为对比正例:单形容词权重弱,但形容词 + 量化数值权重强。


v8.1 雷达扫描召唤静态而非动态(2026-05-14 实测)

发现来源:异界气象台 minitest 收尾·总览图 v3 测试

问题:prompt 写 a sweeping radar scan line ... sweeping clockwise,期望是”动态扫描线”。实际 4 张跑出静态雷达光带 + 同心圆脉冲——没有”运动”概念。

规律:MJ 是图像生成模型,所有”运动 / 扫描 / 旋转”等动态词都被翻译成静态呈现

应用调整


v8.1 sref 跨色温场景强度阈值(2026-05-14 实测)

发现来源:异界气象台 minitest 第一节·B-v1 镜头测试

问题:使用 sref 基准图(navy 色调)+ prompt 写 “deep saturated purple”,期望出紫色场景。

sw 值实际输出评价
100完全 navy,紫色被吃掉
60teal 青绿(navy 和紫色折中产物)❌ 仍不达标
40-50(推测)应能出现 deep purple 主导待验证

结论:sref 跨色温压制能力很强。当目标色温和 sref 色温显著不同时(如 navy → purple、navy → magenta、teal → red),sw 必须降到 40-50,否则 prompt 的色温描述会被洗掉。

判断阈值


v8.1 sref 工作流变化(2026-05-14 实测)

Web 端 v8.1 的 sref 已从”数字 ID”改为”图片挂载”

对知识库的影响

对项目工作流的影响

v7 + oref 出图特点


风险预案(如果 v7 + oref 不达标)

Step 1:v7 + oref 跑 1-2 个 A 类镜头测试

   评估"她"的气质保留度 vs 主基准图

   ├─ ≥ 80% → 走 v7 + oref(主推)
   ├─ 60-80% → v7 + oref + 后期换脸补正
   └─ < 60% → 切换 libtv + nano-banana(节点工具)

       nano 接管所有 A/B 类(角色一致性)
       v8.1 仍管 C 类(美学最大化)

Cowork 推荐顺序

  1. v7 + oref(首试)
  2. libtv + nano-banana(备用)
  3. v8.1 全跑 + FaceFusion / InsightFace 后期换脸(兜底)

「拾色」实战配置

镜号内容类别工具
S01雨打邮局门外Cv8.1
S02邮局内景空镜Cv8.1
S03推门背影Bv7+oref ow50
S04取信特写Av7+oref ow100
S05信封特写Cv8.1
S06看信表情Av7+oref ow100
S07撑伞远景Bv7+oref ow70
S08室内换装暗示Av7+oref ow100
S09抽屉题眼Cv8.1
S10-S11闪回手部Cv8.1
S12弄堂行走Bv7+oref ow60
S13邮局复入Bv7+oref ow70
S14邮局远景Cv8.1
S15直视镜头Av7+oref ow100
S16黑场Cv8.1

统计:A 类 4 / B 类 4 / C 类 8。


「封面抽卡场景」的行为规律(异界气象台 minitest v2 实测沉淀)

入档时间:2026-05-14(运营经理 + Cowork 双方确认) 触发:异界气象台 minitest 封面 v2,32 张 MJ 实测(首轮 24 + 横屏补抽 8) 关联:入场票框架_v1.1迭代待办暂存 补丁 2/3/6/7

封面属于”无 cref/oref”的子场景,但有独有的行为规律,与 A/B/C 三类角色场景不完全重叠。

规律 1 · 五重反字幕约束(100% 有效率)

封面 prompt 必须包含:no text, no labels, no logos, no subtitles, no banners

理由:MJ V8.1 在没有强压制时,会按”它理解的央视/纪录片画面”自带生成红条字幕条——对封面是污染。32 张实测 100% 无字幕,验证有效。

适用范围:任何”自带制式画面”的素材(央视格式、新闻联播、动物世界、气象预报、纪录片)都需要这条防御。

规律 2 · 主体尺寸召唤词「单一 > 群体」(封面专属)

召唤词实测主体压倒感
单一主体(colossal / towering / monolithic)+ 形容词激进4-5 分
群体(massive / countless / horde)2-3 分

实测数据

操作指南:封面 prompt 优先用”单一主体 + 形容词激进”。如必须做群体,每个个体单独 prompt,避免依赖群体词。

规律 3 · sref 强度的「视频 - 封面」差分

场景推荐 sw
视频内画面(追求广角连贯感)80
封面(追求主体冲出框)40-50

理由:封面追求”主体压倒”而非”风格一致”。sw 50 同色家族验证一致性 4.7、主体压倒感 4.6——封面默认值。sw 40 适用于跨色家族。

规律 4 · 所有目标比例必须 MJ 原生抽卡(流程层)

禁止:从 9:16 抽卡通过 PIL 扩展 / 裁剪 / 翻转得到 16:9 / 4:3。

实测对比

操作指南:每个目标比例(9:16 / 3:4 / 16:9 / 4:3)必须独立 MJ prompt,第一轮就抽出来。

规律 5 · sw 不是主体形态杠杆,prompt 文本才是

反例:异界气象台 C-v1 用 monolithic mechanical lifeforms + sw 40,4 张全部跑成”弯腰前行的人类剪影”。降 sw 不能纠正歧义

修复:必须改 prompt 文本——weathered ancient industrial machinery, no glow, no neon, no humanoid form 类显式排除。

操作指南:当 MJ 跑出”概念歧义”时(如”机械生命”→“人形”),优先调 prompt 文本,而非调 sw。


关联文档

类型/档案