前言
在AI视频生成中,提示词(Prompt)是连接你创意与最终画面的桥梁。它决定了视频的内容、动态、美学和叙事。提示词越精准、越丰富,生成的视频就越贴合你的想象。
本教程将带你从基础到精通,系统掌握AI视频提示词的编写方法,并涵盖声音控制、参考视频生成、多镜头叙事等高级技巧。
第一章:基础公式 ------ 快速上手
适用场景:初次尝试、灵感启发、快速生成。
公式:
主体 + 场景 + 运动
这是构建任何视频提示词的基石。你只需要描述清楚三个核心要素:
| 要素 | 说明 | 示例 |
|---|---|---|
| 主体 | 视频的主要表现对象。可以是人、动物、植物、物品,或任何想象出的物体。 | "一只穿着宇航服的柴犬"、"一朵发光的蓝色玫瑰"、"一位古代的剑客"。 |
| 场景 | 主体所处的环境,包含背景与前景。可以是真实空间或虚构场景。 | "在火星的红色沙漠上"、"漂浮在赛博朋克城市的夜空中"、"站在悬崖边,身后是汹涌的大海"。 |
| 运动 | 主体的具体运动或画面中的非主体运动状态。 | "快乐地奔跑"、"花瓣缓缓飘落"、"身体随着微风轻轻摇摆"。 |
基础公式示例:
一只穿着宇航服的柴犬,在火星的红色沙漠上,快乐地奔跑。
第二章:进阶公式 ------ 质感与叙事
适用场景:有明确创意需求、追求高质感和故事性的视频。
公式:
主体描述 + 场景描述 + 运动描述 + 美学控制 + 风格化
在基础公式之上,增加四个维度的细节,让画面更加生动、专业。
1. 主体描述
用形容词或短句细化主体的外观特征。
- 示例:"一位身着残破却华丽的唐代襦裙、发髻高挽、眼神坚毅的女将军。"
2. 场景描述
细化环境中的光线、物体、氛围等细节。
- 示例:"在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,空气中弥漫着薄雾。"
3. 运动描述
细化运动的幅度、速率和作用效果。
- 示例:"长剑在空中划出一道迅捷的银色弧光,斩断了飘落的竹叶。"
4. 美学控制
通过镜头语言控制画面的视觉效果(详见第四章)。
5. 风格化
指定画面整体的艺术风格(详见第六章)。
进阶公式示例:
主体描述 :一位身着残破唐代襦裙、发髻高挽、眼神坚毅的女将军,
场景描述 :在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,
运动描述 :猛然拔剑,长剑在空中划出一道迅捷的银色弧光,
美学控制 :中景,慢动作,逆光,
风格化:电影感,冷色调。
第三章:特殊场景公式
3.1 图生视频公式
适用场景:基于一张参考图生成视频。图像已确定主体、场景和风格,提示词只需描述动态。
公式:
运动 + 运镜
| 要素 | 说明 | 示例 |
|---|---|---|
| 运动 | 结合图像中已有元素,描述其动态过程。 | "画面中的女孩微微侧头,长发被微风吹起。" |
| 运镜 | 控制镜头的运动方式。若不需要运镜,可明确写"固定镜头"。 | "镜头从女孩的面部缓慢推进。" |
3.2 声音生成公式 (适用于万相2.5模型)
适用场景:需要AI同步生成与画面匹配的人声、音效或背景音乐。
公式:
主体 + 场景 + 运动 + 声音描述
声音描述包含以下三类,可按需组合:
| 声音类型 | 描述结构 | 示例 |
|---|---|---|
| 人声 | "说话内容" + 情绪 + 语调 + 语速 + 音色 | "他愤怒地吼道:'快走!',声音沙哑而急促。" |
| 音效 | 音源材质 + 行为 + 环境音 | "玻璃杯从桌面摔碎在木地板上,发出清脆的碎裂声,室内一片寂静。" |
| 背景音乐 | 背景音乐/配乐 + 风格 | "配乐是忧伤的大提琴独奏,缓慢而低沉。" |
3.3 参考生视频公式 (适用于万相2.6模型)
适用场景:希望生成的新视频中,主角与参考视频中的角色(人物、卡通、宠物等)在外观、动态甚至音色上保持一致。支持最多2个角色合拍。
公式:
@主角 + 动作 + 台词 + 场景
| 要素 | 说明 |
|---|---|
| @主角 | 通过@符号引用参考视频中的角色,可在提示词中多次引用以控制其行为。 |
| 动作 | 描述主角或其他元素的运动、表情、情绪变化等。 |
| 台词 | 主角的说话内容,支持单人或多人对话。 |
| 场景 | 主角所处的环境。 |
参考生视频示例:
这是一个充满童趣的童话场景。@A 在草地上蹦跳着玩耍,@B 在旁边的一颗苹果树下弹奏钢琴,一颗苹果掉到了**@B** 的头上,@A 开心的指着**@B** 说:"你要变成科学家了!"。
(注:A的参考视频是一只兔子,B的参考视频是一只狗)
3.4 多镜头公式 (适用于万相2.6模型)
适用场景:生成包含多个镜头、有完整叙事的连贯视频。可手动编写,也可使用"智能多镜"功能。
公式:
总体描述 + [镜头序号 + 时间戳 + 分镜内容]
| 要素 | 说明 |
|---|---|
| 总体描述 | 简述故事主题、叙事风格和核心事件,帮助AI把握全局。 |
| 镜头序号 | 为每个镜头编号,如"第1个镜头"、"第2个镜头"。 |
| 时间戳 | 标明每个镜头在视频中的具体时间范围,如[0-3秒]。 |
| 分镜内容 | 详细描述该镜头的画面、角色动作、台词等,写法可参考单镜头提示词。 |
多镜头公式示例:
这个故事以第三人称视角,讲述了一个关于放弃与重拾希望的短剧。
第1个镜头[0-3秒]:一个男孩在操场的角落独自坐着,低头望着手中的信纸,随后轻轻叹气,眼神中透露出迷茫。
第2个镜头[4-6秒]:硬切转场,固定机位,聚焦于男孩的眼睛,泪光闪烁,带着失落和无助。
第3个镜头[7-10秒]:硬切转场,场景转至一间简朴的教室。一个女孩眼神温和而坚定,穿着朴素的衣着,面带温和而坚定的笑容,走到男孩的身边安慰他。
第四章:电影美学控制词典
通过精准的镜头语言词汇,提升视频的电影感和专业度。
| 类别 | 关键词 | 说明 |
|---|---|---|
| 光源类型 | 自然光、日光、月光、烛光、霓虹灯光、人工光 | 定义画面主要光源。 |
| 光线类型 | 柔光、硬光、逆光、侧光、轮廓光、伦勃朗光 | 定义光线的质地和方向。 |
| 时间段 | 黎明、清晨、正午、黄昏、夜晚、蓝调时刻 | 定义故事发生的时间。 |
| 景别 | 极远景、远景、全景、中景、近景、特写、大特写 | 控制主体在画面中的大小和呈现范围。 |
| 构图 | 中心构图、三分法构图、对称构图、引导线构图、框架构图 | 控制画面的结构美感。 |
| 镜头 | 广角镜头、长焦镜头、鱼眼镜头、微距镜头、移轴镜头 | 定义镜头焦段带来的透视和畸变效果。 |
| 色调 | 暖色调、冷色调、黑白、低饱和、高饱和、赛博朋克色调 | 定义画面的整体色彩氛围。 |
第五章:动态控制词典
精准描述画面中所有运动的细节,让视频活起来。
| 类别 | 关键词 |
|---|---|
| 运动 | 静止、缓慢、快速、加速、减速、剧烈、轻柔、旋转、跳跃、奔跑、飘落、流动 |
| 人物情绪 | 微笑、大笑、哭泣、愤怒、惊恐、平静、沉思、疲惫、兴奋、羞涩 |
| 基础运镜 | 固定镜头、横移、纵移、跟拍、摇镜、升降镜头 |
| 高级运镜 | 推轨(Dolly)、变焦(Zoom)、希区柯克变焦、手持镜头、第一人称视角(POV)、盗梦空间式旋转 |
第六章:风格化表现词典
为你的视频注入独一无二的视觉灵魂。
| 类别 | 关键词 |
|---|---|
| 视觉风格 | 电影感、纪录片风格、动漫风格、写实风格、水墨风、油画风、赛博朋克、废土风格、蒸汽波、极简主义 |
| 特效镜头 | 慢动作、延时摄影、子弹时间、光晕效果、镜头光晕、散景、动态模糊、颗粒感、鱼眼畸变 |