方法论与洞察

图生视频 · Forward-Only 原则

来源:R-07 项目 · 2026-05-11 · 可灵 Kling 3.0/Omni 实跑反馈 适用:所有图生视频工具(可灵 / Seedance / Runway / Veo / Sora 等)

一句话

图生视频的 prompt 必须写”从源图当前状态向后发展(forward-only)“,不能写”实现某个状态”。

源图 = 视频首帧 = 当前已经存在的状态。任何描述”如何到达这个状态”的 prompt 都是反向逻辑——模型唯一的执行方式是”先打破当前状态,再回到当前状态”。

触发案例(R-07 S14)

S14 源图本身已经是”R-07 和兔子对望完成”的瞬间(MJ 阶段锁了高潮)。Prompt 写”R-07 走入开阔地停下,转向兔子,对望”——可灵的执行方式是 R-07 先走出画面右侧,再走回来,再停下 = 不合理动作。

修正:把 13s 全部用在”凝固对望 + 兔子两次微动”,完全去掉 R-07 走入/转身。反而更对位分镜原本的”13 秒对望”核心

风险分级表

类型例子(若源图是结果状态)风险
位置变化”R-07 走入画面” / “R-07 走出画面”🔴 雷区——模型无法忽略,必反向
不可逆姿态”R-07 从面向镜头转为背对”🔴 雷区
镜头反向”镜头从远景拉到中景”(源图已是中景)🔴 雷区——先拉远再拉近
可被忽略动作”R-07 缓慢转身”(若源图已背对)🟡 安全——模型自动跳过
微调延续”R-07 头部继续微调”(从已转向)🟢 安全
主体保持 + 微动”R-07 完全静立 + 颈缆微动”🟢 安全
镜头继续推进”镜头从中景继续推到中近景”🟢 安全

设计 prompt 的两条规则

  1. 先看源图当前状态——R-07 在哪 / 姿态如何 / 蝶在哪 / 镜头景别
  2. prompt 只写”从这一刻起,接下来 X 秒发生什么”——不要描述”如何到达这一刻”

跨工具的本质

虽然在 R-07 是可灵 3.0/Omni 实验出来的,但 Forward-Only 是图生视频范式的根本约束,不是某个工具的怪癖:

→ 所有图生视频工具都遵守这条。

如何使用

写图生视频 prompt 之前的 30 秒自检:

  1. 我描述的所有运动,是否都是从源图状态”向前”发展?
  2. 有没有任何一句话暗示”主体改变位置 / 镜头改变景别 / 姿态从 A 变到 B”——其中 A 不是源图状态?
  3. 如果有,改成”从源图状态(B)继续向前”。

对应的”安全设计”思路

当源图本身已经是高潮 / 结果状态(常见于 MJ 锁了关键帧后的图生视频):

推论:静态 MJ 出图阶段的设计

R-07 项目 MJ 出图阶段大量锁”高潮瞬间”(S5 蝶接触前 / S14 对望 / S8 题眼)。这种锁法对图生视频是双刃剑:

→ 如果后续项目要走图生视频路线,MJ 阶段可以考虑锁”过程瞬间”而不是”高潮瞬间”,给图生视频留出”向前发展到高潮”的空间。

但 R-07 项目里,凝固延长策略反而非常契合”安静的剩余”调性——这是个项目调性 ↔ 工具约束的偶然契合,不一定适用于其他项目。

关联

类型/IP视觉