方法论与洞察

画风 Lora 数据集策划方法论

项目来源:2026-05-08 「THE GAZE」画风 Lora 数据集策划全过程 主线项目:Lora_GAZE_数据集/(31 张数据集 + 完整批次日志) 入档:2026-05-08 适用范围:用 MJ profile 生成数据 → SDXL 系底模(Illustrious-XL 优先)炼制画风 Lora


一句话总结

画风 Lora 的核心不是”出图能力”而是”画风密度控制能力”。MJ profile 在不同 prompt 配方下表达力差异极大,数据集策划的本质就是逼 profile 输出一致的画风密度。撞墙后第一反应不是”换 profile”,而是”调装饰描述权重”。


一、profile 行为四规律(实测沉淀)

规律 1:profile 不会漂移(在合理时间内)

只要不主动 retrain personalize,profile 数月内行为稳定。验证方式:用同一 prompt + profile 重新生成,对比与原图的画风一致性。

⚠️ 风险点:如果用户在 MJ 持续点赞/降权,profile 会被被动训练出现漂移。首次接手项目第一件事:跑一次原始 prompt 验证 profile 状态。

规律 2:profile 的画风表达力 ∝ 画面装饰密度

这是最关键的发现。同一个 profile:

根因:MJ 在画面没有足够”高密度装饰载体”时偷懒,会调用通用 fallback 风格,profile 的特征语言无法充分表达。

对应配方:往任何低密度场景的 prompt 强插入下面任意一项,逼出 profile 真实力:

规律 3:profile 会被主题描述拽偏

实测的两个偏移陷阱

对应配方

规律 4:profile 服从局部,违抗全局

生效的局部描述

经常被忽略的全局描述

对应配方


二、数据集策划方法论

方法论 1:构图轴 + 横切轴的二维结构

构图轴(一级目录):极致面部特写 / 半身像 / 全身像 / 纯场景 / 多人构图 / 动作姿态

横切轴(元数据追踪):主体类型、光照类型、配饰风格

好处:避免数据集在某一维度过度集中。例:如果只按”主体”建库,会忽视构图比例失衡;如果只按”构图”建库,会忽视主体多样性。

方法论 2:分布配额(30-40 张数据集参考)

类型配额配额逻辑
极致面部特写≤ 8过多会让 Lora 学到”画风 = 特写脸”的偏见
半身像8-10训练泛化能力的核心载体
全身像5-8验证画风脱离面部特写的关键
纯场景3-5验证画风脱人能力的关键
多人构图2-3验证多主体场景画风一致性
动作姿态2-3验证动态构图画风稳定性

主体硬约束

光照覆盖:每种光照(暖光 / 阴天 / 室内暖光 / 强逆光 / 月光蓝调 / 高调明亮)至少 3 张

方法论 3:「用户上传 → 第三方筛选」工作流

关键洞察:作者本人筛选有主观偏好(“我最满意的”),第三方按统一标准筛选对数据集贡献度更准。

工作流:

[用户] 用 MJ 模板生成 4 张 → [用户] 全部打包发审核方
       → [审核方] 按画风一致性 + 数据集贡献度判断
       → [审核方] 入档/淘汰 + 更新元数据
       → [审核方] 反馈缺口 + 下批生成建议

严格的一票否决项(满足任一即淘汰):

方法论 4:「严格画风一致性 > 可选维度填充」

当某个”可选”主体多样性(如儿童/少年)的几张图画风偏离时,宁可空缺也不入档。Lora 是在”平均”所有训练图,少 1 张多样性维度可以接受,画风污染会全局影响最终模型。


三、prompt 配方库(实测可复用)

通用模板(锁定区 + 可变区)

[CONTENT_BLOCK:主体 + 装饰 + 构图 + 背景],
semi-realistic style,
[TONE_BLOCK:光照描述],
fine brushwork texture, hand-painted brushstrokes,
real coser thick application, pseudo-thick application, thick application illustration,
light and shadow depiction, strong visual impact,
ultra-high-definition quality, 18k resolution
--profile [your profile id] --ar 9:16

七种光照配方

编号关键词注意事项
T1cold tones, cinematic lighting, dramatic chiaroscuro shadows数据集”画风密度天花板”配方,配室内宫廷场景最稳
T2warm afternoon sunlight, soft shadows配室内场景(蕾丝窗帘 / 教堂彩绘玻璃)
T3overcast diffused lighting, soft shadows⚠️ profile 弱区,必须搭配高密度金属/银线刺绣救场
T4indoor warm light, golden hour glow, soft candlelight高成功率,配室内+蜡烛/吊灯
T5dramatic backlight, golden hour sunset, intense lens flare, sun rays piercing through clouds戏剧化最强
T6pitch black night sky, full moon as only light source, no warm light sources必须显式删除所有暖光锚点
T7bright daylight, high key lighting, clear blue sky⚠️ 风险光照,必须搭配高密度金属盔甲 + 雪山远景压住扁平化

高成功率场景配方

场景 A:宫廷暗调(最强配方,画风密度天花板)

黑发 + 金红宝石王冠 + 暗红丝绒礼服 + 金链项链 + 红宝石坠饰 + 金权杖 + T1 cold cinematic + 室内王座厅 + 雕花烛台 + 大理石柱

场景 B:法师工作室(高密度装饰示范)

栗棕发 + 深蓝丝绸法袍 + 金线绣符文 + 银腰带 + 多戒指 + 紫宝石法杖 + T4 室内暖光 + 飘浮书 + 黄铜吊灯

场景 C:神社夜景(T6 月光蓝调成功配方)

巫女装 + 银色胸甲 + 金色凤凰刺绣 + 武士刀 + T6 + 鸟居 + 石灯笼 + 樱花飘落

场景 D:海边灯塔(无人物纯场景画风密度顶级)

黄铜灯顶 + 铁艺栏杆 + 玻璃 orbs + 雕花 + T5 强逆光 + 远景帆船 + 海鸥 + 浪花

场景 E:双人构图(多人配方)

角色色卡完全互补(hair / eye / 服装颜色全对立)+ 共享高密度装饰锚点(围棋盘、烛台等)+ T4 烛光

失败配方黑名单

「少儿户外水彩」陷阱:白色连衣裙 + 草地蓝天 + T7 高调日光 + 海贝壳/小元素 → 必出小清新水彩 ❌ 「自然环境冷色」陷阱:户外森林 + 阴天柔光 + 简洁皮甲 → 必出概念图 ❌ 「老年油画」陷阱:deep wrinkles + 写实暖光 → 必出油画


四、反例案例与教训

反例 1:elf-ranger 全身(批次 #3)

prompt:女精灵游侠 + 森林 + 阴天柔光 + 皮甲弓箭。 失败原因:自然环境主导 + 配饰描述过于简洁,profile 走概念水彩路线。入选率 1/4

教训催生规律 2(画风表达力 ∝ 装饰密度)。

反例 2:fortuneteller 中老年(批次 #5)

prompt:老年女占卜师 + deep wrinkles + 烛光 + 塔罗牌。 失败原因:MJ 训练数据偏见拉向写实油画。入选率 1/4

教训催生规律 3(主题陷阱清单)。

反例 3:teen-girl 少女(批次 #7)

prompt:少女 + 白连衣裙 + 草地蓝天 + 玻璃萤火虫罐。 失败原因:纯白服装 + 户外自然 + T7 高调日光 = 小清新水彩温床。入选率 0/4,全部淘汰

教训催生严格画风一致性 > 可选维度填充原则。


五、关键判断节点速查

情境第一反应
profile 输出画风偏淡 / 像水彩检查 prompt 装饰密度,往 CONTENT_BLOCK 强插入金属/宝石描述
想要 full body 但出 cowboy shot静态构图加 head to toe + central 50%;动态构图放弃强求
月光蓝调出成日光显式删除所有暖光锚点,加 no warm light sources
老年角色出油画风deep wrinkles,加 smooth anime-style skin rendering
户外自然环境画风弱强插入金属武器/精雕饰品/银线刺绣
数据集要不要加这张检查”画风一致性”和”对当前缺口的贡献度”,缺口高优先

六、实战验收:THE GAZE 项目结果(2026-05-08)

按本方法论训练的 jspider_art_v1 Lora(31 张数据集 / Illustrious-XL v0.1 底模 / Prodigy / 12 epoch)在 3 维度泛化测试中的表现,是验证本方法论有效性的活证据。

验收方法(3 维度泛化测试)

维度设计意图评估重点
测试 1:纯场景神殿(金线雕刻 + 黄铜灯笼)验证画风脱人能力半厚涂金属感是否在无人物时仍成立
测试 2:现代赛博朋克少女(与训练数据零主题重合)验证 Lora 学的是画风信号还是主题信号在题材最远的 prompt 上画风密度是否在线
测试 3:户外日光精灵(无密集金属载体)验证训练数据弱区的画风延续性与 elf-ranger / bard 那批训练样本同源的画风偏弱是否可控

关键发现 1:画风信号 vs 主题信号

测试 2 是整个项目的核心胜利:粉发赛博朋克少女 + 铬金属机械手 + 雨夜霓虹巷 这个主题,与 31 张训练数据完全没有重合(数据集主流是中世纪奇幻 / 神社 / 暗调凝视 / 中国服饰)。但画风密度顶级——铬金属机械手、皮夹克皮质感、铆钉链条全部炸裂。

这是评估画风 Lora 训练成功最严苛的标准:

用主题最远的 prompt 测,画风密度仍然在线 → Lora 学到的是”画风信号”。 反之,主题相近时画风强、主题远时画风弱 → Lora 学到的是”主题信号”,训练失败。

本项目通过这个标准——是数据集策划方法论的经验性证明

关键发现 2:epoch 选择的甜点是 6-8

12 epoch / 每 2 epoch 保存的训练设置下,6 个 checkpoint 演变规律:

epoch状态
2-4画风未稳,皮肤偏写实,太早
6画风成型 + 泛化能力最强 → 适合 _soft 备份版本
8画风密度最强 + 反差质感最稳 → 主版本(首选)⭐
10皮肤开始厚涂化 → 过拟合苗头
12明显过拟合(具体角色脸 / 礼服款式 / 王冠款式与单张训练图高度复刻)

结论:默认选 epoch 8 主版本 + epoch 6 soft 版本(双版本发布)。

<lora:jspider_art_v1:1.0>           ← 默认,画风最强
<lora:jspider_art_v1_soft:1.0>     ← 主体复杂时用,画风更克制
<lora:jspider_art_v1:0.7>          ← 想让画风让位给内容描述时降权

关键发现 3:训练数据画风分布决定 Lora 不同 prompt 下的表现

测试 3(户外日光精灵)画风密度比测试 1/2 略弱——这不是 Lora 训练失败,是数据集本身的画风分布特征。训练数据里 elf-ranger / bard / 阴天柔光户外那批本身就偏意境化,Lora 忠实学到了这个分布。

启示

如果某种场景下 Lora 画风偏弱,去看训练数据里类似场景的样本——那才是源头。 想让某种场景的 Lora 输出更强,最有效的修正不是调训练参数,而是回头补强对应类型的训练样本

关键发现 4:双版本发布的实操价值(v1 vs v1_soft 实测对比)

v1(epoch 8)和 v1_soft(epoch 6)在 3 个泛化测试 prompt 上的实测差异:

测试 1(纯场景神殿)

测试 2(赛博朋克少女)⭐ 对比最戏剧化

测试 3(户外日光精灵)

双版本本质区分

v1 是”画风作品”工具——让画面整体进入画风的美学。 v1_soft 是”画风加成”工具——给画面注入画风美学但不损失主题清晰度。 两个版本是互补关系,不是替代关系。

使用边界决策表

场景推荐版本理由
单角色像 / 想要强烈风格化v1(1.0)画风密度顶级
复杂主体(多奇怪元素 / 多角色)v1_soft不会让画风强行覆盖内容描述
与其他风格 Lora 混用v1_soft兼容性好不抢戏
想要画风稍弱保留细节v1 + scale 0.7比 v1_soft 满强度更强一点点
极致概念冲击图v1(1.0)+ ornate/dramatic 词主版本 + 高密度装饰词起飞
户外柔光 / 日常场景v1_softv1 在低金属密度场景容易过画意
商业用途(主体要清晰可识别)v1_soft更稳
自己作品集 / 深度风格化v1更纯粹画风源头

实操结论

⚠️ 只发主版本不发 soft 版本是巨大浪费——两个 checkpoint 都已经训出来了,多一个发布动作几秒钟,但实际使用场景的覆盖度差异巨大。

默认操作

[训练] 12 epoch / 每 2 保存
[选定] epoch 8 = 主版(jspider_art_v1)
[选定] epoch 6 = soft 版(jspider_art_v1_soft)
[发布] 两个都发到本地 SD 库

[使用时] 按"主体清晰度 vs 画风强度"权衡选哪个

七、上线发布方法论(LiblibAI 模型市场实战经验)

训练完成只是 50% 工作量,剩下 50% 是把 Lora 包装成可被陌生用户点开 → 看懂 → 下载 → 评分高的产品。

1. 六张封面图战略(每张回答一个用户问题)

LiblibAI 模型市场列表页用户在缩略图上只有 0.3 秒 决定要不要点进来。每张封面对应回答一个具体的用户疑问:

封面类型回答用户的问题
1(主封面极致特写 + 核心主题”这是个什么画风?“——直接还原画风识别符
2全身 + 高密度装饰”画风密度天花板长什么样?“
3与训练数据零主题重合(最重要)“Lora 在我自己的题材上能用吗?“
4罕见光照下的画风延续”在我常用的光照下还行吗?“
5多人构图”多角色场景能稳吗?“
6纯场景(无人物)“能脱离人物保持画风吗?”

⚠️ 关键反直觉:第 3 张(最远主题)比第 2 张(最强代表作)的转化率更高——LiblibAI 用户最在乎的不是”你 Lora 能多强”,而是”你 Lora 在我自己的题材上能不能用”。

2. 描述字段(短描述)的信息密度公式

LiblibAI 描述字段限制 12 字。别浪费在通用形容词(“好看 / 高质量”),要塞进独家识别点

✅ 好的写法:半厚涂金属反差·凝视画风

❌ 差的写法:高质量二次元画风Lora

3. 详细介绍必须用纯文本

LiblibAI 详情页编辑器不识别 markdown 符号# 标题 / ** 加粗 / | 表格 / 代码块)。这些会变成普通字符显示,破坏排版。

纯文本排版替代方案

详细介绍必含 6 节

  1. 关于系列(一句话定位)
  2. 视觉特征(让用户知道画风识别符)
  3. 触发词(必须放在 prompt 第一个 token 位置 + 警告)
  4. 推荐 prompt 模板(让小白用户能立即上手)
  5. 七种光照配方表(提升专业度信任)
  6. 训练信息(底模 + 参数 + 数据集规模)

4. 关键字段填写避坑清单

「推荐 Checkpoint」找不到自己用的底模

⚠️ LiblibAI 产品 bug:模型详情页”收藏”和发布表单”我的收藏 ckpt”是两个独立列表——你收藏了模型不会自动出现在 ckpt 引用列表里。

应对

「建议权重」陷阱

LiblibAI 默认 0.8——这是妥协值,不温不火

默认影响
0.8(默认)用户第一次试用画风偏弱,留下”还行”印象,评分中庸
1.0(推荐画风 Lora)用户第一次出图就 wow,评分高;嫌强自己会降到 0.7
0.7主体清晰度优先,画风让位

画风 Lora 默认建议 1.0——让画风密度炸裂,给用户第一印象的最大惊喜值。

「VAE / 高清修复」全选 NONE

画风 Lora 不依赖 特定 VAE 和 upscaler。强制推荐反而限制用户自由度——直接选 NONE / 勾”此版本不需要”,不强加偏见。

5. 权限设置(项目商业化的最大决策点)

🔴 「生成内容可商用」是默认勾选的最大陷阱

LiblibAI 默认勾选这一项,多数人不假思索点过——但它意味着:

任何人用你 Lora 出的图,都可以商业销售。

如果你的 Lora 基于自己的原创作品集训练(比如本项目的 31 张 MJ 原图),勾上这项 = 免费让市场上仿冒你画风的商业作品大量涌现,冲掉你自己的商业溢价。

正确做法

❌ 取消勾选「生成内容可商用」
✅ 在描述末尾写:"生成内容仅供个人创作 / 非商用研究使用,商用请联系作者"

这样:

「允许融合」+「不可转售」组合策略

选项推荐理由
✅ 允许进行融合让社区二次创作丰富生态,融合产物受你的许可继承约束
❌ 允许模型转售或融合后出售不勾核心资产保护——别人融合你的 Lora 做出新 Lora 后不能拿去卖

这个组合是”开放传播 + 保护核心商业权益”的折中。

「加密」= 社区不友好信号

加密模型 = 文件不能下载、只能在 LiblibAI 平台用。绝大多数情况下选不加密——加密会被社区认为限制使用,评分大幅降低。

唯一加密的合理场景:你提供付费会员独享版本。免费版本一律不加密。

「LiblibAI 独家模型」的流量扶持权衡

收益代价
✅ 独家平台流量加成(首页推荐、搜索权重)不能在 Civitai / Tensor.art 等海外平台同步发布同款
❌ 非独家多平台分发,海外受众无 LiblibAI 流量扶持

首发建议勾独家——首次发布最缺的就是流量曝光,平台扶持是关键。后续出 v2 / 衍生版本时可发非独家覆盖海外。

6. 标签(Tag)设计

LiblibAI tag 是搜索 SEO 关键词,不是”自我描述”。设计原则:

要写(按高 → 低优先级):

千万不写

数量:5-10 个最佳。太多会稀释每个 tag 的搜索权重。

7. 双版本同步发布

如果你训了主版(v1)和软版(v1_soft):

8. 内容类别(主体 / 风格 / 垂类 / 功能)

LiblibAI 上传时会让你选 4 个分类下拉。每个最多选 3 个避免稀释定位:

分类推荐选项
主体角色 / 人物(画风 Lora 服务对象主要是人物题材)
风格二次元 + 厚涂/半厚涂 + 暗调(如有)
垂类插画 / 角色设计
功能风格化 / 风格迁移

避雷

9. 项目最终金句

训练 Lora 是技术问题,发布 Lora 是产品问题。

训练时你思考”如何让画风学到位”,发布时你必须切换到”如何让陌生用户在 0.3 秒内决定下载我”。

6 张封面 + 12 字描述 + 1 行权限选择,决定了你这套画风的市场命运。


顶层金句段

「画风 Lora 的训练目标不是”复刻原图”,是”提取画风信号”。 profile 不是稳定输出器,是”高方差表达者”——它的画风强度依赖你给它什么样的画面让它表达。 数据集策划的本质,是用 prompt 配方把 profile 逼到画风密度顶峰,并在不同主题上重复这件事,让 Lora 在平均时分离出”画风信号”。」


关联文档

类型/风格审美