方法论与洞察

画风 Lora 数据集策划方法论

项目来源：2026-05-08 「THE GAZE」画风 Lora 数据集策划全过程主线项目：Lora_GAZE_数据集/（31 张数据集 + 完整批次日志）入档：2026-05-08 适用范围：用 MJ profile 生成数据 → SDXL 系底模（Illustrious-XL 优先）炼制画风 Lora

一句话总结

画风 Lora 的核心不是”出图能力”而是”画风密度控制能力”。MJ profile 在不同 prompt 配方下表达力差异极大，数据集策划的本质就是逼 profile 输出一致的画风密度。撞墙后第一反应不是”换 profile”，而是”调装饰描述权重”。

一、profile 行为四规律（实测沉淀）

规律 1：profile 不会漂移（在合理时间内）

只要不主动 retrain personalize，profile 数月内行为稳定。验证方式：用同一 prompt + profile 重新生成，对比与原图的画风一致性。

⚠️ 风险点：如果用户在 MJ 持续点赞/降权，profile 会被被动训练出现漂移。首次接手项目第一件事：跑一次原始 prompt 验证 profile 状态。

规律 2：profile 的画风表达力 ∝ 画面装饰密度

这是最关键的发现。同一个 profile：

在「特写人脸 + 复杂配饰」场景下 → 画风密度顶级（半厚涂金属/宝石全部炸出）
在「全身 + 自然环境」场景下 → 画风被稀释，倾向走概念水彩 / 油画路线

根因：MJ 在画面没有足够”高密度装饰载体”时偷懒，会调用通用 fallback 风格，profile 的特征语言无法充分表达。

对应配方：往任何低密度场景的 prompt 强插入下面任意一项，逼出 profile 真实力：

intricate metal armor with gold filigree
gemstone-encrusted accessories
ornate metal weapon with engraved patterns
silk fabric with embroidered details
polished gemstones, glowing crystal pendant
brass lanterns / candlesticks with engraved details

规律 3：profile 会被主题描述拽偏

实测的两个偏移陷阱：

「老年人物 + 皱纹」陷阱：MJ 训练数据里”deep wrinkles”绑定写实油画风，profile 压不住。表现：皮肤被厚涂化，与原画风的”简洁赛璐璐皮肤”对立。
「少年/少女 + 户外纯自然 + 高调日光」陷阱：触发”小清新水彩 cel-shaded”路径，profile 完全失效。

对应配方：

老年人物：删 deep wrinkles，改 mature face with subtle age lines + 显式加 smooth anime-style skin rendering, semi-realistic flat shading on face, no oil painting texture
少儿主体：避免纯白服装 + 户外自然 + T7 高调日光的组合，改为宫殿 / 神殿 / 装饰性室内 + 高密度金属配饰

规律 4：profile 服从局部，违抗全局

生效的局部描述：

主体特征（发色、瞳色、年龄、性别、服装颜色）✅
装饰描述（金属/宝石/织物）✅
--ar 参数 ✅
单点光照锚词（pitch black、golden hour glow、candlelight）✅

经常被忽略的全局描述：

full body shot / head to toe ⚠️ 在 9:16 + 复杂前景下经常被吞，输出 cowboy shot
moonlight, blue hour ⚠️ 与暖光载体（brass lanterns、warm light）共存时被冲淡

对应配方：

想要真 full body：加 head to toe entire body visible, character occupies central 50% of frame, wide angle composition，但动态构图下放弃强求（接受 cowboy shot）
想要真月光：显式删除所有暖光锚点，加 pitch black night sky, full moon as only light source, no warm light sources

二、数据集策划方法论

方法论 1：构图轴 + 横切轴的二维结构

构图轴（一级目录）：极致面部特写 / 半身像 / 全身像 / 纯场景 / 多人构图 / 动作姿态

横切轴（元数据追踪）：主体类型、光照类型、配饰风格

好处：避免数据集在某一维度过度集中。例：如果只按”主体”建库，会忽视构图比例失衡；如果只按”构图”建库，会忽视主体多样性。

方法论 2：分布配额（30-40 张数据集参考）

类型	配额	配额逻辑
极致面部特写	≤ 8	过多会让 Lora 学到”画风 = 特写脸”的偏见
半身像	8-10	训练泛化能力的核心载体
全身像	5-8	验证画风脱离面部特写的关键
纯场景	3-5	验证画风脱人能力的关键
多人构图	2-3	验证多主体场景画风一致性
动作姿态	2-3	验证动态构图画风稳定性

主体硬约束：

单一角色 ≤ 4 张（避免 Lora 记住人脸）
单一构图模式 ≤ 5 张（避免画风绑定单一构图）

光照覆盖：每种光照（暖光 / 阴天 / 室内暖光 / 强逆光 / 月光蓝调 / 高调明亮）至少 3 张

方法论 3：「用户上传 → 第三方筛选」工作流

关键洞察：作者本人筛选有主观偏好（“我最满意的”），第三方按统一标准筛选对数据集贡献度更准。

工作流：

[用户] 用 MJ 模板生成 4 张 → [用户] 全部打包发审核方
       → [审核方] 按画风一致性 + 数据集贡献度判断
       → [审核方] 入档/淘汰 + 更新元数据
       → [审核方] 反馈缺口 + 下批生成建议

严格的一票否决项（满足任一即淘汰）：

画风明显跑偏（皮肤过度厚涂 / 配饰失去厚涂质感 / 整体过于赛璐璐扁平）
解剖严重崩坏
与已入选图相似度 ≥ 80%

方法论 4：「严格画风一致性 > 可选维度填充」

当某个”可选”主体多样性（如儿童/少年）的几张图画风偏离时，宁可空缺也不入档。Lora 是在”平均”所有训练图，少 1 张多样性维度可以接受，画风污染会全局影响最终模型。

三、prompt 配方库（实测可复用）

通用模板（锁定区 + 可变区）

[CONTENT_BLOCK：主体 + 装饰 + 构图 + 背景],
semi-realistic style,
[TONE_BLOCK：光照描述],
fine brushwork texture, hand-painted brushstrokes,
real coser thick application, pseudo-thick application, thick application illustration,
light and shadow depiction, strong visual impact,
ultra-high-definition quality, 18k resolution
--profile [your profile id] --ar 9:16

七种光照配方

编号	关键词	注意事项
T1	`cold tones, cinematic lighting, dramatic chiaroscuro shadows`	数据集”画风密度天花板”配方，配室内宫廷场景最稳
T2	`warm afternoon sunlight, soft shadows`	配室内场景（蕾丝窗帘 / 教堂彩绘玻璃）
T3	`overcast diffused lighting, soft shadows`	⚠️ profile 弱区，必须搭配高密度金属/银线刺绣救场
T4	`indoor warm light, golden hour glow, soft candlelight`	高成功率，配室内+蜡烛/吊灯
T5	`dramatic backlight, golden hour sunset, intense lens flare, sun rays piercing through clouds`	戏剧化最强
T6	`pitch black night sky, full moon as only light source, no warm light sources`	必须显式删除所有暖光锚点
T7	`bright daylight, high key lighting, clear blue sky`	⚠️ 风险光照，必须搭配高密度金属盔甲 + 雪山远景压住扁平化

高成功率场景配方

场景 A：宫廷暗调（最强配方，画风密度天花板）

黑发 + 金红宝石王冠 + 暗红丝绒礼服 + 金链项链 + 红宝石坠饰 + 金权杖 + T1 cold cinematic + 室内王座厅 + 雕花烛台 + 大理石柱

场景 B：法师工作室（高密度装饰示范）

栗棕发 + 深蓝丝绸法袍 + 金线绣符文 + 银腰带 + 多戒指 + 紫宝石法杖 + T4 室内暖光 + 飘浮书 + 黄铜吊灯

场景 C：神社夜景（T6 月光蓝调成功配方）

巫女装 + 银色胸甲 + 金色凤凰刺绣 + 武士刀 + T6 + 鸟居 + 石灯笼 + 樱花飘落

场景 D：海边灯塔（无人物纯场景画风密度顶级）

黄铜灯顶 + 铁艺栏杆 + 玻璃 orbs + 雕花 + T5 强逆光 + 远景帆船 + 海鸥 + 浪花

场景 E：双人构图（多人配方）

角色色卡完全互补（hair / eye / 服装颜色全对立）+ 共享高密度装饰锚点（围棋盘、烛台等）+ T4 烛光

失败配方黑名单

❌ 「少儿户外水彩」陷阱：白色连衣裙 + 草地蓝天 + T7 高调日光 + 海贝壳/小元素 → 必出小清新水彩 ❌ 「自然环境冷色」陷阱：户外森林 + 阴天柔光 + 简洁皮甲 → 必出概念图 ❌ 「老年油画」陷阱：deep wrinkles + 写实暖光 → 必出油画

四、反例案例与教训

反例 1：elf-ranger 全身（批次 #3）

prompt：女精灵游侠 + 森林 + 阴天柔光 + 皮甲弓箭。失败原因：自然环境主导 + 配饰描述过于简洁，profile 走概念水彩路线。入选率 1/4。

教训催生规律 2（画风表达力 ∝ 装饰密度）。

反例 2：fortuneteller 中老年（批次 #5）

prompt：老年女占卜师 + deep wrinkles + 烛光 + 塔罗牌。失败原因：MJ 训练数据偏见拉向写实油画。入选率 1/4。

教训催生规律 3（主题陷阱清单）。

反例 3：teen-girl 少女（批次 #7）

prompt：少女 + 白连衣裙 + 草地蓝天 + 玻璃萤火虫罐。失败原因：纯白服装 + 户外自然 + T7 高调日光 = 小清新水彩温床。入选率 0/4，全部淘汰。

教训催生严格画风一致性 > 可选维度填充原则。

五、关键判断节点速查

情境	第一反应
profile 输出画风偏淡 / 像水彩	检查 prompt 装饰密度，往 CONTENT_BLOCK 强插入金属/宝石描述
想要 full body 但出 cowboy shot	静态构图加 `head to toe + central 50%`；动态构图放弃强求
月光蓝调出成日光	显式删除所有暖光锚点，加 `no warm light sources`
老年角色出油画风	删 `deep wrinkles`，加 `smooth anime-style skin rendering`
户外自然环境画风弱	强插入金属武器/精雕饰品/银线刺绣
数据集要不要加这张	检查”画风一致性”和”对当前缺口的贡献度”，缺口高优先

六、实战验收：THE GAZE 项目结果（2026-05-08）

按本方法论训练的 jspider_art_v1 Lora（31 张数据集 / Illustrious-XL v0.1 底模 / Prodigy / 12 epoch）在 3 维度泛化测试中的表现，是验证本方法论有效性的活证据。

验收方法（3 维度泛化测试）

维度	设计意图	评估重点
测试 1：纯场景神殿（金线雕刻 + 黄铜灯笼）	验证画风脱人能力	半厚涂金属感是否在无人物时仍成立
测试 2：现代赛博朋克少女（与训练数据零主题重合）	验证 Lora 学的是画风信号还是主题信号	在题材最远的 prompt 上画风密度是否在线
测试 3：户外日光精灵（无密集金属载体）	验证训练数据弱区的画风延续性	与 elf-ranger / bard 那批训练样本同源的画风偏弱是否可控

关键发现 1：画风信号 vs 主题信号

测试 2 是整个项目的核心胜利：粉发赛博朋克少女 + 铬金属机械手 + 雨夜霓虹巷 这个主题，与 31 张训练数据完全没有重合（数据集主流是中世纪奇幻 / 神社 / 暗调凝视 / 中国服饰）。但画风密度顶级——铬金属机械手、皮夹克皮质感、铆钉链条全部炸裂。

这是评估画风 Lora 训练成功最严苛的标准：

用主题最远的 prompt 测，画风密度仍然在线 → Lora 学到的是”画风信号”。 反之，主题相近时画风强、主题远时画风弱 → Lora 学到的是”主题信号”，训练失败。

本项目通过这个标准——是数据集策划方法论的经验性证明。

关键发现 2：epoch 选择的甜点是 6-8

12 epoch / 每 2 epoch 保存的训练设置下，6 个 checkpoint 演变规律：

epoch	状态
2-4	画风未稳，皮肤偏写实，太早
6	画风成型 + 泛化能力最强 → 适合 `_soft` 备份版本
8	画风密度最强 + 反差质感最稳 → 主版本（首选）⭐
10	皮肤开始厚涂化 → 过拟合苗头
12	明显过拟合（具体角色脸 / 礼服款式 / 王冠款式与单张训练图高度复刻）

结论：默认选 epoch 8 主版本 + epoch 6 soft 版本（双版本发布）。

<lora:jspider_art_v1:1.0>           ← 默认，画风最强
<lora:jspider_art_v1_soft:1.0>     ← 主体复杂时用，画风更克制
<lora:jspider_art_v1:0.7>          ← 想让画风让位给内容描述时降权

关键发现 3：训练数据画风分布决定 Lora 不同 prompt 下的表现

测试 3（户外日光精灵）画风密度比测试 1/2 略弱——这不是 Lora 训练失败，是数据集本身的画风分布特征。训练数据里 elf-ranger / bard / 阴天柔光户外那批本身就偏意境化，Lora 忠实学到了这个分布。

启示：

如果某种场景下 Lora 画风偏弱，去看训练数据里类似场景的样本——那才是源头。 想让某种场景的 Lora 输出更强，最有效的修正不是调训练参数，而是回头补强对应类型的训练样本。

关键发现 4：双版本发布的实操价值（v1 vs v1_soft 实测对比）

v1（epoch 8）和 v1_soft（epoch 6）在 3 个泛化测试 prompt 上的实测差异：

测试 1（纯场景神殿）

v1：戏剧化背光 + sun rays 强 + 概念冲击力
v1_soft：黄铜质感更圆润，光影柔和，更像精致插画而非概念图

测试 2（赛博朋克少女）⭐ 对比最戏剧化

v1：发光眼睛极强 + 金属手压过主体 + 整体”画风炸裂”
v1_soft：金属感保留但主体清晰度大幅提升——角色脸/项链/十字架挂坠这些细节都看得清
关键差异：v1 是”画风让你忘了内容”，v1_soft 是”画风衬托内容”

测试 3（户外日光精灵）

v1：偏意境化画意感强，与训练数据 elf-ranger 同源风格
v1_soft：更清新插画，主体立体清晰，水晶球折射柔和

双版本本质区分

v1 是”画风作品”工具——让画面整体进入画风的美学。 v1_soft 是”画风加成”工具——给画面注入画风美学但不损失主题清晰度。两个版本是互补关系，不是替代关系。

使用边界决策表

场景	推荐版本	理由
单角色像 / 想要强烈风格化	v1（1.0）	画风密度顶级
复杂主体（多奇怪元素 / 多角色）	v1_soft	不会让画风强行覆盖内容描述
与其他风格 Lora 混用	v1_soft	兼容性好不抢戏
想要画风稍弱保留细节	v1 + scale 0.7	比 v1_soft 满强度更强一点点
极致概念冲击图	v1（1.0）+ ornate/dramatic 词	主版本 + 高密度装饰词起飞
户外柔光 / 日常场景	v1_soft	v1 在低金属密度场景容易过画意
商业用途（主体要清晰可识别）	v1_soft	更稳
自己作品集 / 深度风格化	v1	更纯粹画风源头

实操结论

⚠️ 只发主版本不发 soft 版本是巨大浪费——两个 checkpoint 都已经训出来了，多一个发布动作几秒钟，但实际使用场景的覆盖度差异巨大。

默认操作：

[训练] 12 epoch / 每 2 保存
[选定] epoch 8 = 主版（jspider_art_v1）
[选定] epoch 6 = soft 版（jspider_art_v1_soft）
[发布] 两个都发到本地 SD 库

[使用时] 按"主体清晰度 vs 画风强度"权衡选哪个

七、上线发布方法论（LiblibAI 模型市场实战经验）

训练完成只是 50% 工作量，剩下 50% 是把 Lora 包装成可被陌生用户点开 → 看懂 → 下载 → 评分高的产品。

1. 六张封面图战略（每张回答一个用户问题）

LiblibAI 模型市场列表页用户在缩略图上只有 0.3 秒 决定要不要点进来。每张封面对应回答一个具体的用户疑问：

序	封面类型	回答用户的问题
1（主封面）	极致特写 + 核心主题	”这是个什么画风？“——直接还原画风识别符
2	全身 + 高密度装饰	”画风密度天花板长什么样？“
3	与训练数据零主题重合（最重要）	“Lora 在我自己的题材上能用吗？“
4	罕见光照下的画风延续	”在我常用的光照下还行吗？“
5	多人构图	”多角色场景能稳吗？“
6	纯场景（无人物）	“能脱离人物保持画风吗？”

⚠️ 关键反直觉：第 3 张（最远主题）比第 2 张（最强代表作）的转化率更高——LiblibAI 用户最在乎的不是”你 Lora 能多强”，而是”你 Lora 在我自己的题材上能不能用”。

2. 描述字段（短描述）的信息密度公式

LiblibAI 描述字段限制 12 字。别浪费在通用形容词（“好看 / 高质量”），要塞进独家识别点：

✅ 好的写法：半厚涂金属反差·凝视画风

“金属反差” 是独家
“半厚涂” 是技法
“凝视画风” 是品牌后缀

❌ 差的写法：高质量二次元画风Lora

全是通用词，与市场上 100 个其他 Lora 撞描述

3. 详细介绍必须用纯文本

LiblibAI 详情页编辑器不识别 markdown 符号（# 标题 / ** 加粗 / | 表格 / 代码块）。这些会变成普通字符显示，破坏排版。

纯文本排版替代方案：

章节分隔：用空行（双空行 = 强分隔）
强调：用「」括号或大写
列表：用顿号或换行
代码：用单独段落 + 缩进

详细介绍必含 6 节：

关于系列（一句话定位）
视觉特征（让用户知道画风识别符）
触发词（必须放在 prompt 第一个 token 位置 + 警告）
推荐 prompt 模板（让小白用户能立即上手）
七种光照配方表（提升专业度信任）
训练信息（底模 + 参数 + 数据集规模）

4. 关键字段填写避坑清单

「推荐 Checkpoint」找不到自己用的底模

⚠️ LiblibAI 产品 bug：模型详情页”收藏”和发布表单”我的收藏 ckpt”是两个独立列表——你收藏了模型不会自动出现在 ckpt 引用列表里。

应对：

优先：去模型市场详情页找”添加到 ckpt 引用”按钮（如果有）
兜底：选 LiblibAI 平台预置的「基础算法 XL」（SDXL 1.0 base），不严格匹配但兼容性最广
同步：在描述里强调推荐底模名称，让用户自己找

「建议权重」陷阱

LiblibAI 默认 0.8——这是妥协值，不温不火。

默认	影响
0.8（默认）	用户第一次试用画风偏弱，留下”还行”印象，评分中庸
1.0（推荐画风 Lora）	用户第一次出图就 wow，评分高；嫌强自己会降到 0.7
0.7	主体清晰度优先，画风让位

画风 Lora 默认建议 1.0——让画风密度炸裂，给用户第一印象的最大惊喜值。

「VAE / 高清修复」全选 NONE

画风 Lora 不依赖 特定 VAE 和 upscaler。强制推荐反而限制用户自由度——直接选 NONE / 勾”此版本不需要”，不强加偏见。

5. 权限设置（项目商业化的最大决策点）

🔴 「生成内容可商用」是默认勾选的最大陷阱

LiblibAI 默认勾选这一项，多数人不假思索点过——但它意味着：

任何人用你 Lora 出的图，都可以商业销售。

如果你的 Lora 基于自己的原创作品集训练（比如本项目的 31 张 MJ 原图），勾上这项 = 免费让市场上仿冒你画风的商业作品大量涌现，冲掉你自己的商业溢价。

正确做法：

❌ 取消勾选「生成内容可商用」
✅ 在描述末尾写："生成内容仅供个人创作 / 非商用研究使用，商用请联系作者"

这样：

个人玩家能自由出图、社区分享 → 不阻碍传播
商用必须找你授权 → 保留商业化主导权
留下潜在收入入口

「允许融合」+「不可转售」组合策略

选项	推荐	理由
✅ 允许进行融合	勾	让社区二次创作丰富生态，融合产物受你的许可继承约束
❌ 允许模型转售或融合后出售	不勾	核心资产保护——别人融合你的 Lora 做出新 Lora 后不能拿去卖

这个组合是”开放传播 + 保护核心商业权益”的折中。

「加密」= 社区不友好信号

加密模型 = 文件不能下载、只能在 LiblibAI 平台用。绝大多数情况下选不加密——加密会被社区认为限制使用，评分大幅降低。

唯一加密的合理场景：你提供付费会员独享版本。免费版本一律不加密。

「LiblibAI 独家模型」的流量扶持权衡

选	收益	代价
✅ 独家	平台流量加成（首页推荐、搜索权重）	不能在 Civitai / Tensor.art 等海外平台同步发布同款
❌ 非独家	多平台分发，海外受众	无 LiblibAI 流量扶持

首发建议勾独家——首次发布最缺的就是流量曝光，平台扶持是关键。后续出 v2 / 衍生版本时可发非独家覆盖海外。

6. 标签（Tag）设计

LiblibAI tag 是搜索 SEO 关键词，不是”自我描述”。设计原则：

✅ 要写（按高 → 低优先级）：

画风技法词（半厚涂 / 厚涂 / 赛璐璐）
大类入口词（二次元）
系列品牌词（如本项目的”凝视画风”）
美学辨识词（暗调 / 戏剧化光影）
应用场景词（角色立绘 / 古风 / 概念美术）

❌ 千万不写：

写实类（真人 / 摄影 / 三次元）→ 误导用户去错的方向
控制类（修手 / 修脸 / 增强细节）→ 这是控制类 Lora 的标签
主体细分（萝莉 / 御姐 / 大胸）→ 与画风 Lora 不匹配
描述性形容词（高质量 / 免费 / 商用）→ 不是搜索 tag

数量：5-10 个最佳。太多会稀释每个 tag 的搜索权重。

7. 双版本同步发布

如果你训了主版（v1）和软版（v1_soft）：

同时发到 LiblibAI——多一个版本几分钟，但覆盖的用户场景多一倍
主版做主推
软版作为”version 2”或独立条目都可以
软版可以共用主版的封面图（减少出图工作量），但描述里说明”画风更柔和、适用场景”

8. 内容类别（主体 / 风格 / 垂类 / 功能）

LiblibAI 上传时会让你选 4 个分类下拉。每个最多选 3 个避免稀释定位：

分类	推荐选项
主体	角色 / 人物（画风 Lora 服务对象主要是人物题材）
风格	二次元 + 厚涂/半厚涂 + 暗调（如有）
垂类	插画 / 角色设计
功能	风格化 / 风格迁移

避雷：

主体选”写实 / 真人” → 误导
风格选”摄影 / 真人” → 误导
功能选”控制类 / 修手 / 增强细节” → 不匹配

9. 项目最终金句

训练 Lora 是技术问题，发布 Lora 是产品问题。

训练时你思考”如何让画风学到位”，发布时你必须切换到”如何让陌生用户在 0.3 秒内决定下载我”。

6 张封面 + 12 字描述 + 1 行权限选择，决定了你这套画风的市场命运。

顶层金句段

「画风 Lora 的训练目标不是”复刻原图”，是”提取画风信号”。 profile 不是稳定输出器，是”高方差表达者”——它的画风强度依赖你给它什么样的画面让它表达。 数据集策划的本质，是用 prompt 配方把 profile 逼到画风密度顶峰，并在不同主题上重复这件事，让 Lora 在平均时分离出”画风信号”。」

关联文档

主线项目：{AIGC工作站}/Lora_GAZE_数据集\（31 张数据集）
数据集元数据：{AIGC工作站}/Lora_GAZE_数据集\_meta\进度看板.md / 筛选日志.md / prompts.md
起点 prompt 模板：{AIGC工作站}/Lora_GAZE_数据集\Lora数据集补图_MJ模板.md（工作区根）
转交文档：{AIGC工作站}/Lora炼制项目转交文档.md（项目背景与决策）
关联方法论：personalize与moodboard分工（profile 在 MJ 工作流中的定位）
关联档案：multi_sref行为（同类工具行为洞察）
顶层方法论：角色一致性金字塔

类型/风格审美