AI视频生成提示词工程完全指南

前言

在AI视频生成中,提示词(Prompt)是连接你创意与最终画面的桥梁。它决定了视频的内容、动态、美学和叙事。提示词越精准、越丰富,生成的视频就越贴合你的想象。

本教程将带你从基础到精通,系统掌握AI视频提示词的编写方法,并涵盖声音控制、参考视频生成、多镜头叙事等高级技巧。


第一章:基础公式 ------ 快速上手

适用场景:初次尝试、灵感启发、快速生成。

公式

主体 + 场景 + 运动

这是构建任何视频提示词的基石。你只需要描述清楚三个核心要素:

要素 说明 示例
主体 视频的主要表现对象。可以是人、动物、植物、物品,或任何想象出的物体。 "一只穿着宇航服的柴犬"、"一朵发光的蓝色玫瑰"、"一位古代的剑客"。
场景 主体所处的环境,包含背景与前景。可以是真实空间或虚构场景。 "在火星的红色沙漠上"、"漂浮在赛博朋克城市的夜空中"、"站在悬崖边,身后是汹涌的大海"。
运动 主体的具体运动或画面中的非主体运动状态。 "快乐地奔跑"、"花瓣缓缓飘落"、"身体随着微风轻轻摇摆"。

基础公式示例

一只穿着宇航服的柴犬,在火星的红色沙漠上,快乐地奔跑。


第二章:进阶公式 ------ 质感与叙事

适用场景:有明确创意需求、追求高质感和故事性的视频。

公式

主体描述 + 场景描述 + 运动描述 + 美学控制 + 风格化

在基础公式之上,增加四个维度的细节,让画面更加生动、专业。

1. 主体描述

用形容词或短句细化主体的外观特征。

  • 示例:"一位身着残破却华丽的唐代襦裙、发髻高挽、眼神坚毅的女将军。"

2. 场景描述

细化环境中的光线、物体、氛围等细节。

  • 示例:"在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,空气中弥漫着薄雾。"

3. 运动描述

细化运动的幅度、速率和作用效果。

  • 示例:"长剑在空中划出一道迅捷的银色弧光,斩断了飘落的竹叶。"

4. 美学控制

通过镜头语言控制画面的视觉效果(详见第四章)。

5. 风格化

指定画面整体的艺术风格(详见第六章)。

进阶公式示例

主体描述 :一位身着残破唐代襦裙、发髻高挽、眼神坚毅的女将军,
场景描述 :在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,
运动描述 :猛然拔剑,长剑在空中划出一道迅捷的银色弧光,
美学控制 :中景,慢动作,逆光,
风格化:电影感,冷色调。


第三章:特殊场景公式

3.1 图生视频公式

适用场景:基于一张参考图生成视频。图像已确定主体、场景和风格,提示词只需描述动态。

公式

运动 + 运镜

要素 说明 示例
运动 结合图像中已有元素,描述其动态过程。 "画面中的女孩微微侧头,长发被微风吹起。"
运镜 控制镜头的运动方式。若不需要运镜,可明确写"固定镜头"。 "镜头从女孩的面部缓慢推进。"

3.2 声音生成公式 (适用于万相2.5模型)

适用场景:需要AI同步生成与画面匹配的人声、音效或背景音乐。

公式

主体 + 场景 + 运动 + 声音描述

声音描述包含以下三类,可按需组合:

声音类型 描述结构 示例
人声 "说话内容" + 情绪 + 语调 + 语速 + 音色 "他愤怒地吼道:'快走!',声音沙哑而急促。"
音效 音源材质 + 行为 + 环境音 "玻璃杯从桌面摔碎在木地板上,发出清脆的碎裂声,室内一片寂静。"
背景音乐 背景音乐/配乐 + 风格 "配乐是忧伤的大提琴独奏,缓慢而低沉。"

3.3 参考生视频公式 (适用于万相2.6模型)

适用场景:希望生成的新视频中,主角与参考视频中的角色(人物、卡通、宠物等)在外观、动态甚至音色上保持一致。支持最多2个角色合拍。

公式

@主角 + 动作 + 台词 + 场景

要素 说明
@主角 通过@符号引用参考视频中的角色,可在提示词中多次引用以控制其行为。
动作 描述主角或其他元素的运动、表情、情绪变化等。
台词 主角的说话内容,支持单人或多人对话。
场景 主角所处的环境。

参考生视频示例

这是一个充满童趣的童话场景。@A 在草地上蹦跳着玩耍,@B 在旁边的一颗苹果树下弹奏钢琴,一颗苹果掉到了**@B** 的头上,@A 开心的指着**@B** 说:"你要变成科学家了!"。
(注:A的参考视频是一只兔子,B的参考视频是一只狗)

3.4 多镜头公式 (适用于万相2.6模型)

适用场景:生成包含多个镜头、有完整叙事的连贯视频。可手动编写,也可使用"智能多镜"功能。

公式

总体描述 + [镜头序号 + 时间戳 + 分镜内容]

要素 说明
总体描述 简述故事主题、叙事风格和核心事件,帮助AI把握全局。
镜头序号 为每个镜头编号,如"第1个镜头"、"第2个镜头"。
时间戳 标明每个镜头在视频中的具体时间范围,如[0-3秒]
分镜内容 详细描述该镜头的画面、角色动作、台词等,写法可参考单镜头提示词。

多镜头公式示例

这个故事以第三人称视角,讲述了一个关于放弃与重拾希望的短剧。

第1个镜头[0-3秒]:一个男孩在操场的角落独自坐着,低头望着手中的信纸,随后轻轻叹气,眼神中透露出迷茫。

第2个镜头[4-6秒]:硬切转场,固定机位,聚焦于男孩的眼睛,泪光闪烁,带着失落和无助。

第3个镜头[7-10秒]:硬切转场,场景转至一间简朴的教室。一个女孩眼神温和而坚定,穿着朴素的衣着,面带温和而坚定的笑容,走到男孩的身边安慰他。


第四章:电影美学控制词典

通过精准的镜头语言词汇,提升视频的电影感和专业度。

类别 关键词 说明
光源类型 自然光、日光、月光、烛光、霓虹灯光、人工光 定义画面主要光源。
光线类型 柔光、硬光、逆光、侧光、轮廓光、伦勃朗光 定义光线的质地和方向。
时间段 黎明、清晨、正午、黄昏、夜晚、蓝调时刻 定义故事发生的时间。
景别 极远景、远景、全景、中景、近景、特写、大特写 控制主体在画面中的大小和呈现范围。
构图 中心构图、三分法构图、对称构图、引导线构图、框架构图 控制画面的结构美感。
镜头 广角镜头、长焦镜头、鱼眼镜头、微距镜头、移轴镜头 定义镜头焦段带来的透视和畸变效果。
色调 暖色调、冷色调、黑白、低饱和、高饱和、赛博朋克色调 定义画面的整体色彩氛围。

第五章:动态控制词典

精准描述画面中所有运动的细节,让视频活起来。

类别 关键词
运动 静止、缓慢、快速、加速、减速、剧烈、轻柔、旋转、跳跃、奔跑、飘落、流动
人物情绪 微笑、大笑、哭泣、愤怒、惊恐、平静、沉思、疲惫、兴奋、羞涩
基础运镜 固定镜头、横移、纵移、跟拍、摇镜、升降镜头
高级运镜 推轨(Dolly)、变焦(Zoom)、希区柯克变焦、手持镜头、第一人称视角(POV)、盗梦空间式旋转

第六章:风格化表现词典

为你的视频注入独一无二的视觉灵魂。

类别 关键词
视觉风格 电影感、纪录片风格、动漫风格、写实风格、水墨风、油画风、赛博朋克、废土风格、蒸汽波、极简主义
特效镜头 慢动作、延时摄影、子弹时间、光晕效果、镜头光晕、散景、动态模糊、颗粒感、鱼眼畸变
相关推荐
从零开始学习人工智能1 小时前
从PDF到智能问答:RAG-Anything多模态银行文档处理实战解析
大数据·人工智能·pdf
前端不太难2 小时前
AI + 鸿蒙游戏,会不会是下一个爆点?
人工智能·游戏·harmonyos
云和数据.ChenGuang2 小时前
向量数据库chromadb卡顿问题故障
人工智能·ai·bge-large-zh·ai大模型技术·大模型路径故障
156082072192 小时前
基于RFsoc和AI模块的8通道并行同步采集、回放
人工智能
视觉光源老郑2 小时前
破解视觉检测难题,从选对“光”开始
人工智能
聚铭网络2 小时前
【一周安全资讯0321】工信部启动工业数据筑基行动,建设面向AI赋能的高质量行业数据集;360回应“安全龙虾”私钥泄露事件
人工智能·安全
Alonse_沃虎电子2 小时前
沃虎电子:音频变压器5大痛点剖析与厂家定制化解决方案
网络·音视频·信息与通信·产品·介绍·电子元器件
数字冰雹2 小时前
数字孪生携手AIGC:一个指令,一座智慧城市的全景智能即刻生成
人工智能·ai·aigc·智慧城市·数字孪生·数据可视化
jkyy20142 小时前
破解零售增长瓶颈,AI智能营养师成为保健品成交新引擎
大数据·人工智能·健康医疗·零售