图生视频 · Forward-Only 原则
来源:R-07 项目 · 2026-05-11 · 可灵 Kling 3.0/Omni 实跑反馈 适用:所有图生视频工具(可灵 / Seedance / Runway / Veo / Sora 等)
一句话
图生视频的 prompt 必须写”从源图当前状态向后发展(forward-only)“,不能写”实现某个状态”。
源图 = 视频首帧 = 当前已经存在的状态。任何描述”如何到达这个状态”的 prompt 都是反向逻辑——模型唯一的执行方式是”先打破当前状态,再回到当前状态”。
触发案例(R-07 S14)
S14 源图本身已经是”R-07 和兔子对望完成”的瞬间(MJ 阶段锁了高潮)。Prompt 写”R-07 走入开阔地停下,转向兔子,对望”——可灵的执行方式是 R-07 先走出画面右侧,再走回来,再停下 = 不合理动作。
修正:把 13s 全部用在”凝固对望 + 兔子两次微动”,完全去掉 R-07 走入/转身。反而更对位分镜原本的”13 秒对望”核心。
风险分级表
| 类型 | 例子(若源图是结果状态) | 风险 |
|---|---|---|
| 位置变化 | ”R-07 走入画面” / “R-07 走出画面” | 🔴 雷区——模型无法忽略,必反向 |
| 不可逆姿态 | ”R-07 从面向镜头转为背对” | 🔴 雷区 |
| 镜头反向 | ”镜头从远景拉到中景”(源图已是中景) | 🔴 雷区——先拉远再拉近 |
| 可被忽略动作 | ”R-07 缓慢转身”(若源图已背对) | 🟡 安全——模型自动跳过 |
| 微调延续 | ”R-07 头部继续微调”(从已转向) | 🟢 安全 |
| 主体保持 + 微动 | ”R-07 完全静立 + 颈缆微动” | 🟢 安全 |
| 镜头继续推进 | ”镜头从中景继续推到中近景” | 🟢 安全 |
设计 prompt 的两条规则
- 先看源图当前状态——R-07 在哪 / 姿态如何 / 蝶在哪 / 镜头景别
- prompt 只写”从这一刻起,接下来 X 秒发生什么”——不要描述”如何到达这一刻”
跨工具的本质
虽然在 R-07 是可灵 3.0/Omni 实验出来的,但 Forward-Only 是图生视频范式的根本约束,不是某个工具的怪癖:
- 图生视频 = 给定首帧 → 预测后续帧
- 任何”先回到非首帧状态”的指令 = 模型必须”假装首帧不是首帧” = 反向操作
→ 所有图生视频工具都遵守这条。
如何使用
写图生视频 prompt 之前的 30 秒自检:
- 我描述的所有运动,是否都是从源图状态”向前”发展?
- 有没有任何一句话暗示”主体改变位置 / 镜头改变景别 / 姿态从 A 变到 B”——其中 A 不是源图状态?
- 如果有,改成”从源图状态(B)继续向前”。
对应的”安全设计”思路
当源图本身已经是高潮 / 结果状态(常见于 MJ 锁了关键帧后的图生视频):
- 思路 1:把镜头改成”凝固类”(完全静止 + 微动延长)。结果状态被延长 → 强化”凝结感”
- 思路 2:让运动从结果状态”继续向后”(如蝶继续移动 / R-07 继续行走出框)
- 绝对不要:让画面”先打破结果状态再回到”
推论:静态 MJ 出图阶段的设计
R-07 项目 MJ 出图阶段大量锁”高潮瞬间”(S5 蝶接触前 / S14 对望 / S8 题眼)。这种锁法对图生视频是双刃剑:
- 优势:每张图视觉张力最强
- 风险:Forward-Only 限制下,图生视频只能”凝固延长” + “继续向后”,失去”从平淡到高潮”的过程感
→ 如果后续项目要走图生视频路线,MJ 阶段可以考虑锁”过程瞬间”而不是”高潮瞬间”,给图生视频留出”向前发展到高潮”的空间。
但 R-07 项目里,凝固延长策略反而非常契合”安静的剩余”调性——这是个项目调性 ↔ 工具约束的偶然契合,不一定适用于其他项目。
关联
- 02_参数行为档案 / 可灵Kling3_0_行为规律.md
- 03_prompt模板库 / 可灵图生视频_中文prompt模板库.md
- R-07 项目 Wave 2 反馈(S14 v1 → v2)