MJ v8.1 无 oref/cref · 混合工作流
入档:2026-05-12(D2 晚间) 触发:「拾色」女主形象试跑时,需要在 v8.1 美学和角色一致性之间做 trade-off 关联:角色一致性金字塔
一句话
v8.1 美学优于 v7,但 v8.1 没有 cref/oref 功能。 解法不是二选一,是按镜头需要分工:
- 必须锁脸的镜头 → v7 + oref
- 无人物 / 局部 / 远景 → v8.1 美学最大化
如何使用
写一支多镜头作品(MV / 海报组 / 系列封面)前,先把所有镜头按”是否需要清晰看到她的脸”分成 A/B/C 三类:
| 类别 | 定义 | 工具 |
|---|---|---|
| A · 必须锁脸 | 脸是主体(特写 / 半身正面 / 看表情) | v7 + oref —ow 100 |
| B · 半锁脸 | 半身侧背 / 远景轮廓 | v7 + oref —ow 50-70 |
| C · 无需锁脸 | 道具 / 局部 / 场景 / 远景 / 手部 / 黑场 | v8.1(美学最大化 + 无 reference) |
典型分布:16 镜作品里 A 类约 25% / B 类约 25% / C 类约 50%。
C 类占一半 → 整片综合美学接近 v8.1 全片,只有”她的脸”的镜头损失 v7 的美学差。
v7 vs v8.1 实测对比(拾色 D2)
v8.1 出图特点
- ✅ 真实质感更强(皮肤 / 织物 / 光影)
- ✅ photographic realism 关键词响应更准
- ✅ Hasselblad / Kodak Portra 等胶片关键词改变质感
- ✅ 长 prompt 解读更精准
- ❌ 没有 cref / oref / character reference 功能
- ❌ 每次 seed 不同,脸会漂移
v8.1 inset frame 双层结构稳定执行(2026-05-14 实测)
发现来源:异界气象台 minitest 第一节·深海第七断层 prompt 测试(A-v3 组)
prompt 写入:
... ultra wide top-down satellite view of an unknown ocean region as the main image, a smaller inset square frame in the upper right corner showing a cross-section diagram of an underwater trench ...
结果:MJ V8.1 在 4 张抽卡中全部稳定召出”主图 + 右上角子图”的标准排版——主图是俯瞰场景,子图小窗口里是 cross-section / radar scan / topographic 等技术示意图。
关键能力:
- “inset frame” / “inset square frame in the upper right corner” 指令稳定执行
- 子图内容可由 prompt 后续描述指定(cross-section / radar / topographic / scope view 等)
- 子图与主图视觉风格保持一致(同色温、同质感),不会出现”现代 UI 子图”违和
应用场景:
- 央视气象图主图 + 雷达扫描子图(异界气象台 minitest 实测)
- 监控录像 + 监控目标特写子图
- 仪表盘 + 单一仪表读数子图
- 任何”档案/纪录片/报告”语境的复合信息呈现
注意事项:
- 子图位置(upper right / upper left / lower right …)按 prompt 指令稳定执行
- “smaller inset square frame” 比 “small picture-in-picture” 更精准——前者 MJ 理解为”嵌入边框小窗口”,后者可能被理解为”另一张完整画面叠加”
v8.1 inset frame 子图内容偏离 prompt 的常见模式(2026-05-14 实测追加)
第一节验证过双层叠加(inset frame)100% 稳定召出,但子图具体内容的执行有偏差:
| prompt 写 | 实际跑出 |
|---|---|
cross-section diagram of an underwater trench | ✅ 较准确(剖面图) |
radar scan view with grid scale | ✅ 准确(带刻度的雷达扫描) |
thermal radar visualization with cold color heat map | ⚠️ 偏离 —— 出”温度热点 / 异常事件型景观”,不是”等温线图” |
geological topographic chart | (未测试) |
规律推测:MJ 训练数据里 “radar” / “cross-section” 等”二维可视化技术”图示丰富,但 “thermal heat map” 这类”色彩映射数据可视化”训练样本较少,倾向用”光点 / 红色热区”代替等温线。
应对:想要”等温线图”风格,prompt 写得更直接:topographic isotherm contour map with concentric temperature rings 而非 thermal heat map。
但子图偏离不一定是坏事——异界气象台第三节 A-v2_u0 跑出的”红色温度热点”反而和字幕”-89℃ 温度回升”互锁,是 happy accident。
v8.1 材质属性形容词弱权重(2026-05-14 实测)
prompt 写:
snowflakes have a faint metallic sheen catching the dim ambient light
期望:雪花有金属光泽(暗示”金属味的雪”诗意)。
实际:4 张抽卡全部跑出普通雾雪,没有任何金属感。
规律:MJ V8.1 对”具体材质属性形容词”(metallic sheen / glossy / wet / translucent / iridescent 作为形容词修饰名词时)执行不稳定——它把这些当弱权重 modifier 处理,优先级低于主体形态描述。
应对:把材质属性做成视觉元素本身:
| ❌ 弱(形容词模式) | ✅ 强(视觉元素模式) |
|---|---|
snowflakes with metallic sheen | tiny metallic silver shards mixed with snow particles |
glossy black armor | pitch black armor reflecting bright highlights |
wet skin | skin with visible water droplets on the surface |
iridescent feathers | feathers with rainbow color gradient like oil on water |
v8.1 数量约束 “single / one” 执行不稳定(2026-05-14 实测)
prompt 写:
a single tall thin mechanical figure silhouette barely visible
实际:4 张抽卡里有 2 张跑出了 2-3 个剪影,“single” 数量约束执行率约 50%。
规律:MJ 对”数量词”的执行受 prompt 整体语境干扰。如果 prompt 后续描述了”scattered” / “in the distance” 等空间分布词,“single” 会被忽略。
应对:双重约束 + 强否定:
- 写
a single ... and no other figures anywhere in the entire frame - 或者
exactly one ... only one, nothing else moving in the frame
注意:本节恰好需要”几个剪影”而非”一个”(brief 要求”几个机械生命体的剪影”),所以这次的”数量约束失败”反而符合 brief。是否需要严格 single 看具体需求。
v8.1 “closing transmission/shot” 自动召出 letterbox + 双频道结构(2026-05-14 实测)
发现来源:异界气象台 minitest 收尾·总览图 v2/v3 测试
问题:v3 prompt 没写 letterbox,但 4 张全部跑出了 letterbox + 双弧线结构;v2 prompt 写了 prominent black letterbox bars,但跑出的 4 张里 3 张是双 letterbox 双弧线而非期望的”单 letterbox 单弧线”。
规律:MJ V8.1 把 closing transmission / closing shot 关联到了**“电视信号即将关机的双频道残影 / 录像带切换瞬间”**——这是训练数据里电视档案影像的典型视觉特征。
应用调整:
- 想要 closing 镜头的”单频道”视觉,要在 prompt 里显式排除:
single continuous frame, no signal interruption, no double horizontal split - 想要”双频道分裂感”反而是 happy accident——直接写
closing transmission就能稳定召出
v8.1 双重约束尺寸技巧:稳定锁标记点大小(2026-05-14 实测)
发现来源:异界气象台 minitest 收尾·总览图 12 张抽卡
正例:prompt 写
three small bright white circular markers ... about 2 percent of the frame width each
12 张全部稳定召出清晰、大小合适的白色圆点——MJ 把”形容词(small bright)+ 量化(about 2%)“作为强双重约束执行。
模板:
[形容词描述] [object], about X percent of the frame [width/height] each- 比单独写 “small markers” 或 “tiny dots” 稳定得多
对比反例:第三节 prompt 写 tiny dark dots barely visible——只用形容词,MJ 把”废墟”画得比 prompt 要求更显眼。
回流到”材质属性形容词弱权重”小节作为对比正例:单形容词权重弱,但形容词 + 量化数值权重强。
v8.1 雷达扫描召唤静态而非动态(2026-05-14 实测)
发现来源:异界气象台 minitest 收尾·总览图 v3 测试
问题:prompt 写 a sweeping radar scan line ... sweeping clockwise,期望是”动态扫描线”。实际 4 张跑出静态雷达光带 + 同心圆脉冲——没有”运动”概念。
规律:MJ 是图像生成模型,所有”运动 / 扫描 / 旋转”等动态词都被翻译成静态呈现。
应用调整:
- 不在 prompt 里期望”动态”
- “扫描动作”由后期 MoviePy/AE 实现——MJ 出”扫描线已经定格的某一帧”作为基底
- prompt 写
radar scan line frozen at moment of sweeping比sweeping radar scan line更准确(前者承认是静态帧)
v8.1 sref 跨色温场景强度阈值(2026-05-14 实测)
发现来源:异界气象台 minitest 第一节·B-v1 镜头测试
问题:使用 sref 基准图(navy 色调)+ prompt 写 “deep saturated purple”,期望出紫色场景。
| sw 值 | 实际输出 | 评价 |
|---|---|---|
| 100 | 完全 navy,紫色被吃掉 | ❌ |
| 60 | teal 青绿(navy 和紫色折中产物) | ❌ 仍不达标 |
| 40-50(推测) | 应能出现 deep purple 主导 | 待验证 |
结论:sref 跨色温压制能力很强。当目标色温和 sref 色温显著不同时(如 navy → purple、navy → magenta、teal → red),sw 必须降到 40-50,否则 prompt 的色温描述会被洗掉。
判断阈值:
- 同色温微调(如 navy → 深 navy):sw 100
- 邻色温(如 navy → cyan):sw 70-80
- 跨色温(如 navy → purple/red/green):sw 40-50
- 想完全脱离 sref 色温:不挂 sref,纯 prompt
v8.1 sref 工作流变化(2026-05-14 实测)
Web 端 v8.1 的 sref 已从”数字 ID”改为”图片挂载”:
- ❌ 旧(v7 时代):prompt 末尾写
--sref 5692463053 --sw 100,数字 ID 可跨会话/项目复用 - ✅ 新(v8.1 web 端):点击 prompt 输入框旁的”加图”按钮上传/挂载参考图,UI 显示为图片缩略图挂载状态
- ✅
--sw 100等强度属性照常生效(写在 prompt 文本里) - ⚠️ 无法直接获取 sref 数字 ID(UI 隐藏了 ID 字段)
对知识库的影响:
- 旧 sref 档案命名约定
sref_<数字ID>_<描述>.md不再适用于 v8.1 web 端工作流 - 新约定:
sref_<项目>_<图片名>.md,文件内挂图片路径(相对/绝对都可),而非 ID - 旧档案(如
sref_5692463053_navy现代极简.md)仍适用于 v7 + oref 或 discord 端工作流
对项目工作流的影响:
- sref 母本图片必须保留为本地图片 + 路径稳定(移动/删除原图 = sref 失效,每次都要重新挂)
- 跨项目复用 sref → 把图片复制到新项目目录,在新项目里重新挂载
- 用 MJ Web 端做风格统一项目时,先固定 sref 母本图片的存储位置再开始批量出图——避免中途搬家
v7 + oref 出图特点
- ✅ oref 锁脸一致性 ≈ 85%(跑 8 张里 7 张能保住主气质)
- ✅ 美学比 v8.1 弱 10-15%(但仍可用)
- ⚠️ 部分图唇色偏深 / 神态偏锐利(v7 默认偏好)
- ⚠️
--ow不是越高越好:100 锁得死但缺活气,50-70 留 moodboard 调味空间
风险预案(如果 v7 + oref 不达标)
Step 1:v7 + oref 跑 1-2 个 A 类镜头测试
↓
评估"她"的气质保留度 vs 主基准图
↓
├─ ≥ 80% → 走 v7 + oref(主推)
├─ 60-80% → v7 + oref + 后期换脸补正
└─ < 60% → 切换 libtv + nano-banana(节点工具)
↓
nano 接管所有 A/B 类(角色一致性)
v8.1 仍管 C 类(美学最大化)
Cowork 推荐顺序:
- v7 + oref(首试)
- libtv + nano-banana(备用)
- v8.1 全跑 + FaceFusion / InsightFace 后期换脸(兜底)
「拾色」实战配置
| 镜号 | 内容 | 类别 | 工具 |
|---|---|---|---|
| S01 | 雨打邮局门外 | C | v8.1 |
| S02 | 邮局内景空镜 | C | v8.1 |
| S03 | 推门背影 | B | v7+oref ow50 |
| S04 | 取信特写 | A | v7+oref ow100 |
| S05 | 信封特写 | C | v8.1 |
| S06 | 看信表情 | A | v7+oref ow100 |
| S07 | 撑伞远景 | B | v7+oref ow70 |
| S08 | 室内换装暗示 | A | v7+oref ow100 |
| S09 | 抽屉题眼 | C | v8.1 |
| S10-S11 | 闪回手部 | C | v8.1 |
| S12 | 弄堂行走 | B | v7+oref ow60 |
| S13 | 邮局复入 | B | v7+oref ow70 |
| S14 | 邮局远景 | C | v8.1 |
| S15 | 直视镜头 | A | v7+oref ow100 |
| S16 | 黑场 | C | v8.1 |
统计:A 类 4 / B 类 4 / C 类 8。
「封面抽卡场景」的行为规律(异界气象台 minitest v2 实测沉淀)
入档时间:2026-05-14(运营经理 + Cowork 双方确认) 触发:异界气象台 minitest 封面 v2,32 张 MJ 实测(首轮 24 + 横屏补抽 8) 关联:入场票框架_v1.1迭代待办暂存 补丁 2/3/6/7
封面属于”无 cref/oref”的子场景,但有独有的行为规律,与 A/B/C 三类角色场景不完全重叠。
规律 1 · 五重反字幕约束(100% 有效率)
封面 prompt 必须包含:no text, no labels, no logos, no subtitles, no banners。
理由:MJ V8.1 在没有强压制时,会按”它理解的央视/纪录片画面”自带生成红条字幕条——对封面是污染。32 张实测 100% 无字幕,验证有效。
适用范围:任何”自带制式画面”的素材(央视格式、新闻联播、动物世界、气象预报、纪录片)都需要这条防御。
规律 2 · 主体尺寸召唤词「单一 > 群体」(封面专属)
| 召唤词 | 实测主体压倒感 |
|---|---|
| 单一主体(colossal / towering / monolithic)+ 形容词激进 | 4-5 分 |
| 群体(massive / countless / horde) | 2-3 分 |
实测数据:
- B-v1(
massive whales群体)→ 鲸群被画太小,主体感 2-3 分 - B-v2(
colossal whale单一)→ 主体压倒感 5 分 - A 系列(
towering tower单一)→ 4-5 分
操作指南:封面 prompt 优先用”单一主体 + 形容词激进”。如必须做群体,每个个体单独 prompt,避免依赖群体词。
规律 3 · sref 强度的「视频 - 封面」差分
| 场景 | 推荐 sw |
|---|---|
| 视频内画面(追求广角连贯感) | 80 |
| 封面(追求主体冲出框) | 40-50 |
理由:封面追求”主体压倒”而非”风格一致”。sw 50 同色家族验证一致性 4.7、主体压倒感 4.6——封面默认值。sw 40 适用于跨色家族。
规律 4 · 所有目标比例必须 MJ 原生抽卡(流程层)
禁止:从 9:16 抽卡通过 PIL 扩展 / 裁剪 / 翻转得到 16:9 / 4:3。
实测对比:
- PIL 画布扩展 16:9 左留白质量 = 1 分(色块 + 噪点)
- MJ 原生重抽 16:9 左留白质量 = 5 分(真实雾天 + 海面层次)
操作指南:每个目标比例(9:16 / 3:4 / 16:9 / 4:3)必须独立 MJ prompt,第一轮就抽出来。
规律 5 · sw 不是主体形态杠杆,prompt 文本才是
反例:异界气象台 C-v1 用 monolithic mechanical lifeforms + sw 40,4 张全部跑成”弯腰前行的人类剪影”。降 sw 不能纠正歧义。
修复:必须改 prompt 文本——weathered ancient industrial machinery, no glow, no neon, no humanoid form 类显式排除。
操作指南:当 MJ 跑出”概念歧义”时(如”机械生命”→“人形”),优先调 prompt 文本,而非调 sw。
关联文档
- 顶层方法论:角色一致性金字塔(oref/seed/personalize/sref 4 层)
- 账号级地基:personalize与moodboard分工
- IP 应用案例:檐下IP 视觉系统(V4 基准图修复案例)
- 对照参数:ow_行为规律 · seed_行为规律
- 封面抽卡触发本节的源头:
20_异界气象台_minitest/02_视觉/封面_v2/sref调试日志_v2.md