笔记 · 口语化需求 → 专业提示词:图片 + 视频双 skill 复盘
入档:2026-06-03 性质:提示词优化 skill 实测复盘。以「初学小白」的口语化撰写风格作为输入,分别测试图片提示词优化(prompt-master / Midjourney + gpt-image)与视频提示词优化(Seedance 2.0),完整记录「优化前 → 优化后」的过程与方法论。 来源:由两份测试笔记合并整理——《Midjourney 提示词优化复盘》+《雪山单板广告提示词测试过程》。 结论:两类 skill 在「把模糊形容词翻译成可执行画面语言」上效果显著,沉淀出一套可复用的结构公式与模板。
一、测试设计
刻意扮演初学小白,用日常聊天式的中文需求作为输入,观察优化 skill 能否补全专业维度。覆盖两条线:
- 图片线:海报(Midjourney v8.1)、横版广告 9 宫格分镜(gpt-image)。
- 视频线:15 秒产品广告(Seedance 2.0),含纯文字版与「9 宫格分镜参考图」版。
小白输入的共性问题:全是模糊形容词、缺画面元素与镜头语言、无画质/负面词约束、中文且无结构。优化的核心动作就是逐条补全这些缺失维度。
二、图片线 · 案例 A:Midjourney 海报
优化前(小白口语)
帮我画一张很高级的海报,要有科技感,画面好看一点,最好像电影海报一样震撼。里面有一个人在城市里,看起来很未来,很酷,颜色可以蓝色紫色,整体要精致。
指定参数:Midjourney v8.1,画幅 3:4。
问题点:全是模糊形容词(高级、好看、震撼、很酷、精致),无具体画面/构图/光影/镜头语言,无画质关键词与负面词,且为中文。
优化后
cinematic movie poster, lone figure standing in a vast futuristic megacity, sleek high-tech outfit with glowing accents, dramatic hero pose seen from below, towering neon skyscrapers and holographic billboards, volumetric light beams piercing atmospheric haze, deep blue and electric purple color grading, cyberpunk elegance, rim lighting, reflective wet surfaces, intricate detail, ultra-refined composition, anamorphic lens flare, shallow depth of field, epic scale, premium key art, hyper-detailed, dramatic chiaroscuro lighting --ar 3:4 --v 8.1 --style raw --no text, watermark, logo, blurry, low quality
逐句拆解:模糊词 → 精确描述
| 原始模糊词 | 优化后的精确表达 | 作用 |
|---|---|---|
| 像电影海报一样震撼 | cinematic movie poster / premium key art / epic scale | 锁定海报级电影质感 |
| 一个人在城市里 | lone figure standing in a vast futuristic megacity | 明确主体 + 环境 |
| 看起来很未来、很酷 | sleek high-tech outfit with glowing accents / dramatic hero pose seen from below | 服装质感 + 英雄低角度构图 |
| 科技感 | towering neon skyscrapers and holographic billboards / cyberpunk elegance | 具体科技元素 |
| 画面好看 | volumetric light beams / rim lighting / reflective wet surfaces / anamorphic lens flare | 光影与镜头语言 |
| 蓝色紫色 | deep blue and electric purple color grading | 精确调色而非简单颜色名 |
| 整体精致 | intricate detail / ultra-refined composition / hyper-detailed | 细节与构图精度 |
| (隐含)画质要高 | dramatic chiaroscuro lighting / shallow depth of field | 明暗对比 + 景深 |
参数说明
| 参数 | 含义 |
|---|---|
--ar 3:4 | 竖版画幅,符合海报比例(按需求指定) |
--v 8.1 | 使用最新 Midjourney v8.1 模型 |
--style raw | 减少自动美化,保留更真实有质感的电影感 |
--no text, watermark, logo, blurry, low quality | 负面词,排除文字、水印、logo、模糊与低画质 |
三、图片线 · 案例 B:gpt-image 横版广告 9 宫格分镜
优化前(小白口语)
我想制作一个横版产品广告,产品为雪山单板,生成 9 宫格分镜图,我希望高端、上档次、有画面张力,15 秒广告。
优化重点
- 明确画幅:横版 16:9。
- 明确图像类型:9 宫格广告分镜图,而非单张海报。
- 明确产品质感:黑色碳纤维、金属银边缘、冰晶、专业高端运动装备。
- 明确广告调性:电影级、奢侈品广告、雪山极地、高反差光影、冷峻蓝白色调。
- 明确 15 秒节奏:氛围建立 → 产品特写 → 运动爆发 → 最终英雄镜头。
- 明确排除项:不要文字、字幕、logo、水印。
优化后
生成一张横版 16:9 的高端产品广告 9 宫格分镜图,用于一支 15 秒雪山单板广告。画面为干净的电影级广告分镜板,每格都是一个独立镜头,整体统一为奢华、高端、极具画面张力的雪山运动品牌广告风格。
产品:一块高端雪山单板,黑色碳纤维质感板面,局部有金属银色边缘与细腻浮雕纹理,造型修长、锋利、专业,体现高级运动装备与极限性能。
画面风格:电影广告摄影,奢侈品产品广告质感,雪山极地环境,冷峻蓝白色调,少量金属银与深黑对比,高反差光影,强烈体积光,雪雾、飞雪、冰晶颗粒,干净背景,真实材质,高级构图,动态张力,超清细节,商业广告级后期。
9 宫格内容:
1. 黎明雪山远景,巨大山脊与晨光,雪地中隐约出现单板轮廓,建立高级极地氛围。
2. 单板特写,黑色碳纤维纹理、金属边缘、冰晶附着,产品质感清晰。
3. 运动员戴上护目镜,手持单板站在山顶,背后是强烈逆光与雪雾。
4. 单板压入新雪,雪粉被板刃切开,低机位高速特写。
5. 运动员高速滑行穿越雪坡,大片雪雾在身后炸开,画面有速度感。
6. 空中跃起瞬间,单板横切画面,雪山和天空形成巨大空间张力。
7. 单板在冰面上旋转落地,板面品牌感突出但不要出现文字 logo。
8. 产品英雄镜头,单板悬浮在雪山背景前,边缘有冷光勾勒,像奢侈品广告主视觉。
9. 结束镜头,单板静置在山顶雪面,远处日光穿透云层,画面留有广告收尾空间,但不要添加任何文字。
版式要求:严格 3x3 九宫格,每格比例一致,清晰分隔,横版整图,干净分镜图,不要文字,不要字幕,不要 logo,不要水印。每格都像电影广告关键帧,视觉连续,节奏对应 15 秒广告,从氛围建立、产品特写、运动爆发到最终英雄镜头。
推荐参数:
尺寸:wide 或 16:9
质量:high
风格关键词:cinematic luxury product commercial, premium snowboard, alpine, high contrast, ultra realistic, dynamic snow powder
四、视频线 · 案例 C:Seedance 2.0 15 秒广告
优化前(小白口语)
我想把刚才那个雪山单板广告做成视频,15 秒左右,要高级、震撼、有速度感,像大片广告一样。最好能有雪山、产品特写、滑雪动作和最后的产品展示。
指定工具:Seedance 2.0。
问题点:只有广告目标和大致元素,但没有时间段落、镜头运动、产品材质锚点、声音设计、平台限制和参考素材角色分配。Seedance 这类视频模型如果只收到”高级、震撼、有速度感”,很容易随机剪、产品变形、动作过快或生成不可控文字。
优化思路
Seedance 2.0 更适合用时间段落控制 10 秒以上的视频,因此把 15 秒广告拆为 5 段:
- 0–3s:雪山环境建立 + 产品轮廓出现。
- 3–6s:产品材质特写。
- 6–10s:高速滑行动作。
- 10–13s:跳跃慢动作高潮。
- 13–15s:最终产品英雄镜头。
视频提示词中额外强化:摄影机运动(push-in、macro tracking、low-angle follow shot、slow-motion orbit、pull-back)、声音设计(电子管弦乐、低频冲击、雪板切雪声、风声、雪雾声、冰晶细节声)、平台限制(避免清晰真实人脸,运动员用头盔/护目镜/围巾 + 动态模糊)。
优化后(纯文字版)
Create a 15-second premium cinematic product commercial for a high-end alpine snowboard.
The hero product is a luxury snowboard with a black carbon fiber surface, metallic silver edges, subtle embossed technical texture, sharp aerodynamic shape, and professional extreme-sports performance. No visible logo, no text, no watermark.
0–3s:
A wide establishing shot of a cold alpine snow mountain at dawn. Blue-white snowfields, sharp mountain ridges, thin mist, and golden sunrise light breaking through clouds. The snowboard is half-buried in untouched powder snow, only its elegant black silhouette visible. Camera slowly pushes in from a wide shot to a medium product reveal. Atmosphere is quiet, premium, and powerful.
3–6s:
Extreme close-up montage of the snowboard surface: carbon fiber texture, metallic edge, ice crystals, snow particles sliding across the board. Use macro lens, shallow depth of field, sharp reflections, cold rim light. Camera glides along the board edge with a smooth tracking movement. Add subtle light scan across the product surface.
6–10s:
A professional snowboarder in sleek black winter gear rides down a steep snowy slope. Do not show a clear realistic face; use helmet, goggles, scarf, and motion blur. Low-angle follow shot close to the snowboard as the edge cuts into fresh powder. Snow explodes behind the board. Fast dynamic tracking, strong speed sensation, dramatic snow spray, high visual tension.
10–13s:
The snowboarder launches off a natural snow ridge into the air. Slow motion moment. The snowboard crosses the frame against a massive mountain and sky background. Camera performs a smooth orbit around the board and rider, then follows the landing. Snow particles sparkle in sunlight, epic and luxurious commercial energy.
13–15s:
Final hero product shot. The snowboard stands alone on the mountain summit, clean and elegant, surrounded by drifting snow and cold blue light. Camera slowly pulls back while sunrise light outlines the board edges. Leave clean negative space for a future brand tagline, but do not generate any text.
Visual style:
Luxury sports product commercial, cinematic quality, 2.35:1 widescreen feel, photorealistic, high contrast lighting, cold blue-white color palette with black and metallic silver accents, premium advertising photography, dramatic snow powder, volumetric light, crisp material details, elegant and powerful.
Camera:
Smooth push-in, macro tracking, low-angle high-speed follow shot, slow-motion orbit, final cinematic pull-back. Use clean premium transitions, no chaotic cuts.
Sound design:
Grand cinematic electronic orchestral background music, deep bass impact during action moments, sharp snowboard edge cutting through snow, soft wind, snow spray, subtle ice crystal sounds. Music builds from quiet luxury tension to an epic climax, then resolves into a clean premium ending.
Duration: exactly 15 seconds.
优化后(带 9 宫格分镜参考图版)
若已先用 gpt-image 生成 9 宫格分镜图,可在 Seedance 中将该图作为参考图上传,使用下面版本:
@Image1 as the visual storyboard reference for the entire 15-second video. Use @Image1's product design, snow mountain environment, premium commercial mood, shot order, lighting style, and cinematic composition. Transform the 9 storyboard panels into a smooth 15-second luxury snowboard product commercial.
Create a 15-second premium cinematic product ad for a high-end black carbon fiber alpine snowboard with metallic silver edges. No visible logo, no text, no watermark.
0–3s: Follow the opening storyboard mood: dawn alpine mountain wide shot, snowboard silhouette emerging from untouched powder snow. Slow push-in, quiet luxury atmosphere.
3–6s: Follow the product detail panels: macro close-ups of carbon fiber texture, metallic edge, ice crystals, and snow particles. Smooth tracking along the board edge, shallow depth of field, cold rim light.
6–10s: Follow the action panels: snowboarder in helmet and goggles rides down a steep snow slope. Low-angle high-speed follow shot near the board, snow powder exploding behind, strong motion energy. Avoid clear realistic face.
10–13s: Follow the jump panel: slow-motion aerial moment, snowboard crossing the frame against mountain and sky, smooth orbit camera, dramatic snow particles and sunlight.
13–15s: Follow the final hero panel: snowboard standing alone on the summit, sunrise rim light, drifting snow, clean negative space for future branding, but generate no text.
Style: luxury sports product commercial, photorealistic, cinematic 2.35:1 widescreen feel, high contrast, cold blue-white palette, black and metallic silver product accents, volumetric light, premium advertising photography.
Sound: cinematic electronic orchestral music, deep bass hits, snowboard carving sound, wind, snow spray, ice crystal details. Build to an epic climax, then end cleanly and elegantly.
逐句拆解:模糊需求 → Seedance 可执行指令
| 原始模糊需求 | 优化后的精确表达 | 作用 |
|---|---|---|
| 高级、上档次 | premium cinematic product commercial / luxury sports product commercial | 锁定商业广告而不是普通运动记录 |
| 雪山单板 | black carbon fiber surface, metallic silver edges, embossed technical texture | 给产品可追踪的材质锚点,减少每段外观漂移 |
| 震撼 | wide establishing shot / massive mountain and sky background / volumetric light | 用空间尺度和光影制造视觉冲击 |
| 有速度感 | low-angle high-speed follow shot near the board / snow powder exploding behind | 把速度翻译成低机位跟拍和雪粉反馈 |
| 像大片广告 | smooth push-in, macro tracking, slow-motion orbit, final pull-back | 明确广告片常用运镜,避免随机转场 |
| 产品特写 | extreme close-up montage / macro lens, shallow depth of field | 强化材质细节,让产品广告成立 |
| 滑雪动作 | snowboarder in helmet and goggles / avoid clear realistic face | 保留动作主体,同时规避清晰真实人脸风险 |
| 最后产品展示 | final hero product shot / clean negative space for future brand tagline, but do not generate any text | 留后期字幕空间,避免模型生成乱码字 |
| 没提声音 | electronic orchestral BGM, deep bass impact, snowboard edge cutting, wind, snow spray | 补齐 Seedance 的声音/节奏维度 |
Seedance 设置与素材约束
| 项目 | 建议 |
|---|---|
| 时长 | 15 秒。当前 prompt 已按 0–3s / 3–6s / 6–10s / 10–13s / 13–15s 控制 |
| 画幅 | 横版 16:9 或平台可选的接近横版比例 |
| 模型 | Seedance 2.0 标准版优先;排队过久再试 Fast |
| 参考素材 | 纯文字版无需上传;分镜版上传 9 宫格图为 @Image1 |
| 追加产品参考 | 如果产品漂移,再上传单板定妆图为 @Image2 as the exact product appearance reference |
| 文件上限 | Seedance 参考素材总数控制在 12 个以内 |
| 人脸限制 | 不上传清晰真实人脸素材;运动员使用头盔、护目镜、围巾、运动模糊 |
| 字幕/logo | 品牌名、logo、标语全部后期添加,不要让模型直接生成文字 |
推荐测试流程
- 先用 gpt-image 生成 9 宫格分镜图。
- 从结果中选产品质感最强、镜头节奏最清晰的一张。
- 将 9 宫格分镜图作为 Seedance 的
@Image1上传。 - 用「带参考图版本」的 Seedance prompt 生成 15 秒视频。
- 产品外观不稳定时,额外上传单板产品图作为
@Image2 as the exact product appearance reference。 - 视频节奏不够强时,下一轮重点强化
fast dynamic tracking、slow-motion aerial moment、deep bass impact等动作与声音描述。
注意事项
- 不要让模型生成文字、logo、水印,避免乱码文字;品牌名和标语建议在剪辑软件中单独添加。
- Seedance 上传参考素材总文件数不要超过 12 个;避免上传含清晰真实人脸的参考图/视频。
- 15 秒广告不要塞入过多镜头,保持 5 个清晰阶段更稳定。
五、方法论沉淀(可复用)
通用结构公式
无论图片还是视频,优化的本质都是把模糊形容词翻译成可执行的画面/镜头语言,并补全用户没说的专业维度。
图片提示词结构:
主体 + 环境 + 风格/氛围 + 光影 + 镜头语言 + 画质关键词 + 参数(—ar / —v / —style / —no)
视频提示词结构(Seedance ≥10s):
整体定调 + 产品/主体设定 + 时间段落(逐段画面 + 镜头运动)+ 视觉风格 + 摄影机 + 声音设计 + 时长约束
六条核心经验
- 把形容词翻译成画面——「震撼」不是关键词,「低角度英雄构图 + 体积光」才是。
- 颜色要给调色方案——写
color grading比单纯写颜色名更专业、更可控。 - 补全用户没说但必备的维度——光影、镜头、景深、构图、声音,小白往往不会主动提。
- 结构化短语 + 英文——图片用逗号分隔短语;视频用时间段落,模型理解最佳。
- 永远带负面/排除项——图片用
--no,视频用No visible logo, no text, no watermark,提前排除常见瑕疵。 - 参数与约束显式化——画幅、模型版本、风格模式、时长都写明,避免默认值跑偏。
可复用模板
图片(Midjourney 等):
[画面类型], [主体 + 姿态], [服装/外观细节], [环境/背景元素], [光影效果], [调色方案] color grading, [风格关键词], [镜头语言], [细节/画质关键词] --ar [比例] --v 8.1 --style raw --no text, watermark, logo, blurry, low quality
视频(Seedance 2.0,分镜参考图工作流):见上方「带 9 宫格分镜参考图版」,替换产品设定与各时间段落画面即可复用。
关联文档
- Prompt 入口:03_prompt模板库索引
- 方法论入口:04_方法论与洞察索引
- 相关方法论:prompt的三段式结构_v1、prompt极简化原则_v1、触觉抽象词翻译公式
- 相关流程:Seedance2.0_素材准备清单
- 本次测试所用 skill:prompt-master_v1.6.0_SKILL.md(存于 07_skill存档索引)