prompt模板库

Seedance 2.0 短片制作 · 素材准备清单

项目背景：基于 6 个原创角色 IP 制作 60s+ 多镜头叙事短片 目标平台：B 站（粉丝群运营 + IP 预热） 工具链：角色卡 → GPT img2 生成参考图 → Seedance 2.0 生成视频 → 剪辑软件拼接 → 后期音频合成 跨用途定位：素材同时服务于角色设定档、未来手办/3D 化、游戏开发资产

关于 Seedance 2.0

字节跳动 2026 年 2 月发布的多模态视频生成模型，核心能力：

单次生成最多支持 9 张参考图 + 3 段视频 + 3 段音频 作为参考
单次最长生成 60 秒视频
支持 2K 分辨率输出
支持 首尾帧控制（跨镜头衔接的关键功能）
多镜头中可保持角色面部、体态、服装一致性
真人影像有活体限制（与本项目无关，原创角色不受影响）

官方入口：

项目主页：https://seed.bytedance.com/zh/seedance2_0
即梦 AI 网页版（推荐，全能参考功能最完整）：jimeng.jianying.com
火山方舟体验中心（开发者向，含 API）：volcengine.com
豆包 App（移动端）

一、角色素材（核心，必备）

每个角色一套，共 6 套。每套 5-8 张参考图。

单角色参考图清单

类型	数量	说明	状态
面部特写	1-2 张	五官清晰，正面或微侧	✅ 已有
3/4 角度半身	1 张	最常用的电影化视角	⬜ 待生成
全身正面	1 张	带完整服装细节	⬜ 待生成
表情样本	2-3 张	中性 / 标志性表情 / 情绪表达	⬜ 待生成
标志性动作	1 张	角色的标志性姿势	⬜ 待生成

参考图技术要求

分辨率：≥ 1024×1024
背景：纯色或简洁背景（避免干扰角色特征学习）
命名规范：角色名_类型_序号.png，例如 角色A_面部_01.png
文件管理建议结构：

/Characters
  /角色A
    /ConceptArt          原始角色卡
    /TurnAround          三视图（设定档用）
    /Expressions         表情库
    /Actions             动作参考
    /ColorPalette        配色规范
    /Settings.md         人设文档
    /Relationships.md    角色关系
  /角色B
    ...

重要区分：三视图 vs Seedance 参考图

⚠️ 不要混用

三视图（正/侧/背 T-pose 白底）→ 给手办原型师、3D 建模师、设定档存档用
Seedance 参考图（生活化场景、3/4 角度、动态姿势）→ 给视频生成模型用

死板三视图喂给 Seedance 会让模型把”白底站姿”当成角色特征学进去，生成时容易飘。

二、场景素材

短片中出现的关键场景，每个场景 1-2 张参考图。

场景类型	数量	说明
室内场景	按需	建筑、房间内部
室外场景	按需	自然环境、城市等
关键氛围图	1-2 张	光线、色调、整体环境感

如果世界观视觉化未完成，此项可在与”视觉 Claude”协作敲定基调后补齐。

三、风格基调参考

1-2 张能代表整部短片视觉风格的图。

调色参考（电影截图、插画、摄影作品都行）
镜头语言参考（运镜风格的参考视频或图）

这些不一定喂给模型，但创作者自己心里要有，方便写提示词。

四、脚本 / 分镜表（最关键）

不需要专业分镜，一张表格就够。没有这一步直接开生成 = 必乱。

分镜表模板

镜头	时长	出场角色	场景	动作描述	镜头运动	衔接说明	备注
01	5s	角色 A	森林	角色走向镜头	中景推近	开场
02	6s	角色 A、B	森林空地	两人相遇对视	中景平拍	衔接 01 末帧	用首尾帧
03	8s	角色 B	特写	角色转头说话	特写	衔接 02 末帧
…

镜头规划建议

60s+ 短片建议拆为 6-12 个镜头，每镜头 5-10s
同框角色控制在 2-3 人，多角色场景用远景/中景
同一场景的多个镜头连续生成，避免风格漂移
首尾帧衔接：标记好哪些镜头需要衔接，前一镜头末帧作为下一镜头首帧

五、音频素材（建议后期处理）

虽然 Seedance 2.0 支持音画同步生成，但完整短片建议视频/音频分离处理，可控性更高。

类型	工具建议	说明
背景音乐	Suno / 自找	整片基调
关键音效	音效库	转场、动作音效等
角色配音	TTS（剪映、ElevenLabs）/ 真人	如果有对话

六、执行优先级

第一阶段：流程验证（建议 1-2 天）

准备 1 个角色 的完整参考图集（5-6 张）
准备 1-2 张 场景图
写 3-5 个镜头 的简单分镜表
用即梦”全能参考”跑通 30s 左右的小片段

目的：验证流程顺不顺、参考图够不够用、提示词怎么写最有效。

第二阶段：批量制作

跑通后再批量制作剩下 5 个角色的素材，避免一次性投入大量精力后某个环节有问题导致全要返工。

第三阶段：完整短片

完整脚本 → 全部分镜素材 → 逐镜生成 → 剪辑拼接 → 后期音频。

七、即梦平台使用要点

仅支持抖音扫码登录
入口：网页版 → 视频生成 → 选择 Seedance 2.0 → 「全能参考」或「首尾帧」
积分计费：上传 9 个参考文件 + 15s 时长约 195 积分（实际有波动）
模型选择：标准版优先；排队久可试 Seedance 2.0 Fast
生成后重点检查：口型同步、面部变形、手部异常
一次出片完美率不高，通常需要 2-3 次迭代

八、提示词参考结构

即梦”全能参考”的提示词建议结构：

@图片1 作为说话的角色，面对镜头，[动作/表情描述]
@图片2 作为背景环境参考
[场景描述：地点、氛围、光线]
[镜头运动：景别、运镜方式、节奏]
[整体风格：色调、画面感]

跨镜头衔接的提示词参考：

将 @视频1 延长 [N]s，
角色继续 [动作]，
保持动作连贯流畅，
整体节奏与前段自然衔接。

九、待补充信息（与”视觉 Claude”协作后回填）

6 个角色的最终视觉形象方案
新 IP 世界观基调（科幻 / 奇幻 / 现代 / 其他）
整体画风方向（写实 / 二次元 / 美式 / 卡通）
短片内容定位（剧情 / 日常 / 战斗 / 混剪 PV）
各角色配色规范（十六进制色值清单）
各角色服装材质说明
角色身高、体型、年龄设定
角色关系网

十、注意事项与避坑

三视图与 Seedance 参考图严格分开，用途不同，标准不同
GPT img2 生成三视图：左右侧、背面常与正面对不上（发型、服装漂移），需手动修正或多次生成挑选
配色规范早定：未来手办/3D 化要用，从现有角色卡吸色整理成色卡图
设定档统一管理：建议 PDF 或 Notion，未来给任何合作方一键发送
跨镜头一致性：同一角色出现的所有镜头都喂同一套参考图
首尾帧是跨镜头连贯性最有效的土办法，必须用
音频建议后期处理，不要依赖 Seedance 的音画同步功能做完整短片

文档创建于 2026-05-08，用于跨会话协作存档。

类型/prompt模板