Seedance 2.0 短片制作 · 素材准备清单
项目背景:基于 6 个原创角色 IP 制作 60s+ 多镜头叙事短片 目标平台:B 站(粉丝群运营 + IP 预热) 工具链:角色卡 → GPT img2 生成参考图 → Seedance 2.0 生成视频 → 剪辑软件拼接 → 后期音频合成 跨用途定位:素材同时服务于角色设定档、未来手办/3D 化、游戏开发资产
关于 Seedance 2.0
字节跳动 2026 年 2 月发布的多模态视频生成模型,核心能力:
- 单次生成最多支持 9 张参考图 + 3 段视频 + 3 段音频 作为参考
- 单次最长生成 60 秒视频
- 支持 2K 分辨率输出
- 支持 首尾帧控制(跨镜头衔接的关键功能)
- 多镜头中可保持角色面部、体态、服装一致性
- 真人影像有活体限制(与本项目无关,原创角色不受影响)
官方入口:
- 项目主页:https://seed.bytedance.com/zh/seedance2_0
- 即梦 AI 网页版(推荐,全能参考功能最完整):jimeng.jianying.com
- 火山方舟体验中心(开发者向,含 API):volcengine.com
- 豆包 App(移动端)
一、角色素材(核心,必备)
每个角色一套,共 6 套。每套 5-8 张参考图。
单角色参考图清单
| 类型 | 数量 | 说明 | 状态 |
|---|---|---|---|
| 面部特写 | 1-2 张 | 五官清晰,正面或微侧 | ✅ 已有 |
| 3/4 角度半身 | 1 张 | 最常用的电影化视角 | ⬜ 待生成 |
| 全身正面 | 1 张 | 带完整服装细节 | ⬜ 待生成 |
| 表情样本 | 2-3 张 | 中性 / 标志性表情 / 情绪表达 | ⬜ 待生成 |
| 标志性动作 | 1 张 | 角色的标志性姿势 | ⬜ 待生成 |
参考图技术要求
- 分辨率:≥ 1024×1024
- 背景:纯色或简洁背景(避免干扰角色特征学习)
- 命名规范:
角色名_类型_序号.png,例如角色A_面部_01.png - 文件管理建议结构:
/Characters
/角色A
/ConceptArt 原始角色卡
/TurnAround 三视图(设定档用)
/Expressions 表情库
/Actions 动作参考
/ColorPalette 配色规范
/Settings.md 人设文档
/Relationships.md 角色关系
/角色B
...
重要区分:三视图 vs Seedance 参考图
⚠️ 不要混用
- 三视图(正/侧/背 T-pose 白底)→ 给手办原型师、3D 建模师、设定档存档用
- Seedance 参考图(生活化场景、3/4 角度、动态姿势)→ 给视频生成模型用
死板三视图喂给 Seedance 会让模型把”白底站姿”当成角色特征学进去,生成时容易飘。
二、场景素材
短片中出现的关键场景,每个场景 1-2 张参考图。
| 场景类型 | 数量 | 说明 |
|---|---|---|
| 室内场景 | 按需 | 建筑、房间内部 |
| 室外场景 | 按需 | 自然环境、城市等 |
| 关键氛围图 | 1-2 张 | 光线、色调、整体环境感 |
如果世界观视觉化未完成,此项可在与”视觉 Claude”协作敲定基调后补齐。
三、风格基调参考
1-2 张能代表整部短片视觉风格的图。
- 调色参考(电影截图、插画、摄影作品都行)
- 镜头语言参考(运镜风格的参考视频或图)
这些不一定喂给模型,但创作者自己心里要有,方便写提示词。
四、脚本 / 分镜表(最关键)
不需要专业分镜,一张表格就够。没有这一步直接开生成 = 必乱。
分镜表模板
| 镜头 | 时长 | 出场角色 | 场景 | 动作描述 | 镜头运动 | 衔接说明 | 备注 |
|---|---|---|---|---|---|---|---|
| 01 | 5s | 角色 A | 森林 | 角色走向镜头 | 中景推近 | 开场 | |
| 02 | 6s | 角色 A、B | 森林空地 | 两人相遇对视 | 中景平拍 | 衔接 01 末帧 | 用首尾帧 |
| 03 | 8s | 角色 B | 特写 | 角色转头说话 | 特写 | 衔接 02 末帧 | |
| … |
镜头规划建议
- 60s+ 短片建议拆为 6-12 个镜头,每镜头 5-10s
- 同框角色控制在 2-3 人,多角色场景用远景/中景
- 同一场景的多个镜头连续生成,避免风格漂移
- 首尾帧衔接:标记好哪些镜头需要衔接,前一镜头末帧作为下一镜头首帧
五、音频素材(建议后期处理)
虽然 Seedance 2.0 支持音画同步生成,但完整短片建议视频/音频分离处理,可控性更高。
| 类型 | 工具建议 | 说明 |
|---|---|---|
| 背景音乐 | Suno / 自找 | 整片基调 |
| 关键音效 | 音效库 | 转场、动作音效等 |
| 角色配音 | TTS(剪映、ElevenLabs)/ 真人 | 如果有对话 |
六、执行优先级
第一阶段:流程验证(建议 1-2 天)
- 准备 1 个角色 的完整参考图集(5-6 张)
- 准备 1-2 张 场景图
- 写 3-5 个镜头 的简单分镜表
- 用即梦”全能参考”跑通 30s 左右的小片段
目的:验证流程顺不顺、参考图够不够用、提示词怎么写最有效。
第二阶段:批量制作
跑通后再批量制作剩下 5 个角色的素材,避免一次性投入大量精力后某个环节有问题导致全要返工。
第三阶段:完整短片
完整脚本 → 全部分镜素材 → 逐镜生成 → 剪辑拼接 → 后期音频。
七、即梦平台使用要点
- 仅支持抖音扫码登录
- 入口:网页版 → 视频生成 → 选择 Seedance 2.0 → 「全能参考」或「首尾帧」
- 积分计费:上传 9 个参考文件 + 15s 时长约 195 积分(实际有波动)
- 模型选择:标准版优先;排队久可试 Seedance 2.0 Fast
- 生成后重点检查:口型同步、面部变形、手部异常
- 一次出片完美率不高,通常需要 2-3 次迭代
八、提示词参考结构
即梦”全能参考”的提示词建议结构:
@图片1 作为说话的角色,面对镜头,[动作/表情描述]
@图片2 作为背景环境参考
[场景描述:地点、氛围、光线]
[镜头运动:景别、运镜方式、节奏]
[整体风格:色调、画面感]
跨镜头衔接的提示词参考:
将 @视频1 延长 [N]s,
角色继续 [动作],
保持动作连贯流畅,
整体节奏与前段自然衔接。
九、待补充信息(与”视觉 Claude”协作后回填)
- 6 个角色的最终视觉形象方案
- 新 IP 世界观基调(科幻 / 奇幻 / 现代 / 其他)
- 整体画风方向(写实 / 二次元 / 美式 / 卡通)
- 短片内容定位(剧情 / 日常 / 战斗 / 混剪 PV)
- 各角色配色规范(十六进制色值清单)
- 各角色服装材质说明
- 角色身高、体型、年龄设定
- 角色关系网
十、注意事项与避坑
- 三视图与 Seedance 参考图严格分开,用途不同,标准不同
- GPT img2 生成三视图:左右侧、背面常与正面对不上(发型、服装漂移),需手动修正或多次生成挑选
- 配色规范早定:未来手办/3D 化要用,从现有角色卡吸色整理成色卡图
- 设定档统一管理:建议 PDF 或 Notion,未来给任何合作方一键发送
- 跨镜头一致性:同一角色出现的所有镜头都喂同一套参考图
- 首尾帧是跨镜头连贯性最有效的土办法,必须用
- 音频建议后期处理,不要依赖 Seedance 的音画同步功能做完整短片
文档创建于 2026-05-08,用于跨会话协作存档。