AI视频生成提示词工程完全指南

前言

在AI视频生成中,提示词(Prompt)是连接你创意与最终画面的桥梁。它决定了视频的内容、动态、美学和叙事。提示词越精准、越丰富,生成的视频就越贴合你的想象。

本教程将带你从基础到精通,系统掌握AI视频提示词的编写方法,并涵盖声音控制、参考视频生成、多镜头叙事等高级技巧。


第一章:基础公式 ------ 快速上手

适用场景:初次尝试、灵感启发、快速生成。

公式

主体 + 场景 + 运动

这是构建任何视频提示词的基石。你只需要描述清楚三个核心要素:

要素 说明 示例
主体 视频的主要表现对象。可以是人、动物、植物、物品,或任何想象出的物体。 "一只穿着宇航服的柴犬"、"一朵发光的蓝色玫瑰"、"一位古代的剑客"。
场景 主体所处的环境,包含背景与前景。可以是真实空间或虚构场景。 "在火星的红色沙漠上"、"漂浮在赛博朋克城市的夜空中"、"站在悬崖边,身后是汹涌的大海"。
运动 主体的具体运动或画面中的非主体运动状态。 "快乐地奔跑"、"花瓣缓缓飘落"、"身体随着微风轻轻摇摆"。

基础公式示例

一只穿着宇航服的柴犬,在火星的红色沙漠上,快乐地奔跑。


第二章:进阶公式 ------ 质感与叙事

适用场景:有明确创意需求、追求高质感和故事性的视频。

公式

主体描述 + 场景描述 + 运动描述 + 美学控制 + 风格化

在基础公式之上,增加四个维度的细节,让画面更加生动、专业。

1. 主体描述

用形容词或短句细化主体的外观特征。

  • 示例:"一位身着残破却华丽的唐代襦裙、发髻高挽、眼神坚毅的女将军。"

2. 场景描述

细化环境中的光线、物体、氛围等细节。

  • 示例:"在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,空气中弥漫着薄雾。"

3. 运动描述

细化运动的幅度、速率和作用效果。

  • 示例:"长剑在空中划出一道迅捷的银色弧光,斩断了飘落的竹叶。"

4. 美学控制

通过镜头语言控制画面的视觉效果(详见第四章)。

5. 风格化

指定画面整体的艺术风格(详见第六章)。

进阶公式示例

主体描述 :一位身着残破唐代襦裙、发髻高挽、眼神坚毅的女将军,
场景描述 :在烟雾缭绕的古老竹林深处,一座被青苔覆盖的石制神龛前,
运动描述 :猛然拔剑,长剑在空中划出一道迅捷的银色弧光,
美学控制 :中景,慢动作,逆光,
风格化:电影感,冷色调。


第三章:特殊场景公式

3.1 图生视频公式

适用场景:基于一张参考图生成视频。图像已确定主体、场景和风格,提示词只需描述动态。

公式

运动 + 运镜

要素 说明 示例
运动 结合图像中已有元素,描述其动态过程。 "画面中的女孩微微侧头,长发被微风吹起。"
运镜 控制镜头的运动方式。若不需要运镜,可明确写"固定镜头"。 "镜头从女孩的面部缓慢推进。"

3.2 声音生成公式 (适用于万相2.5模型)

适用场景:需要AI同步生成与画面匹配的人声、音效或背景音乐。

公式

主体 + 场景 + 运动 + 声音描述

声音描述包含以下三类,可按需组合:

声音类型 描述结构 示例
人声 "说话内容" + 情绪 + 语调 + 语速 + 音色 "他愤怒地吼道:'快走!',声音沙哑而急促。"
音效 音源材质 + 行为 + 环境音 "玻璃杯从桌面摔碎在木地板上,发出清脆的碎裂声,室内一片寂静。"
背景音乐 背景音乐/配乐 + 风格 "配乐是忧伤的大提琴独奏,缓慢而低沉。"

3.3 参考生视频公式 (适用于万相2.6模型)

适用场景:希望生成的新视频中,主角与参考视频中的角色(人物、卡通、宠物等)在外观、动态甚至音色上保持一致。支持最多2个角色合拍。

公式

@主角 + 动作 + 台词 + 场景

要素 说明
@主角 通过@符号引用参考视频中的角色,可在提示词中多次引用以控制其行为。
动作 描述主角或其他元素的运动、表情、情绪变化等。
台词 主角的说话内容,支持单人或多人对话。
场景 主角所处的环境。

参考生视频示例

这是一个充满童趣的童话场景。@A 在草地上蹦跳着玩耍,@B 在旁边的一颗苹果树下弹奏钢琴,一颗苹果掉到了**@B** 的头上,@A 开心的指着**@B** 说:"你要变成科学家了!"。
(注:A的参考视频是一只兔子,B的参考视频是一只狗)

3.4 多镜头公式 (适用于万相2.6模型)

适用场景:生成包含多个镜头、有完整叙事的连贯视频。可手动编写,也可使用"智能多镜"功能。

公式

总体描述 + [镜头序号 + 时间戳 + 分镜内容]

要素 说明
总体描述 简述故事主题、叙事风格和核心事件,帮助AI把握全局。
镜头序号 为每个镜头编号,如"第1个镜头"、"第2个镜头"。
时间戳 标明每个镜头在视频中的具体时间范围,如[0-3秒]
分镜内容 详细描述该镜头的画面、角色动作、台词等,写法可参考单镜头提示词。

多镜头公式示例

这个故事以第三人称视角,讲述了一个关于放弃与重拾希望的短剧。

第1个镜头[0-3秒]:一个男孩在操场的角落独自坐着,低头望着手中的信纸,随后轻轻叹气,眼神中透露出迷茫。

第2个镜头[4-6秒]:硬切转场,固定机位,聚焦于男孩的眼睛,泪光闪烁,带着失落和无助。

第3个镜头[7-10秒]:硬切转场,场景转至一间简朴的教室。一个女孩眼神温和而坚定,穿着朴素的衣着,面带温和而坚定的笑容,走到男孩的身边安慰他。


第四章:电影美学控制词典

通过精准的镜头语言词汇,提升视频的电影感和专业度。

类别 关键词 说明
光源类型 自然光、日光、月光、烛光、霓虹灯光、人工光 定义画面主要光源。
光线类型 柔光、硬光、逆光、侧光、轮廓光、伦勃朗光 定义光线的质地和方向。
时间段 黎明、清晨、正午、黄昏、夜晚、蓝调时刻 定义故事发生的时间。
景别 极远景、远景、全景、中景、近景、特写、大特写 控制主体在画面中的大小和呈现范围。
构图 中心构图、三分法构图、对称构图、引导线构图、框架构图 控制画面的结构美感。
镜头 广角镜头、长焦镜头、鱼眼镜头、微距镜头、移轴镜头 定义镜头焦段带来的透视和畸变效果。
色调 暖色调、冷色调、黑白、低饱和、高饱和、赛博朋克色调 定义画面的整体色彩氛围。

第五章:动态控制词典

精准描述画面中所有运动的细节,让视频活起来。

类别 关键词
运动 静止、缓慢、快速、加速、减速、剧烈、轻柔、旋转、跳跃、奔跑、飘落、流动
人物情绪 微笑、大笑、哭泣、愤怒、惊恐、平静、沉思、疲惫、兴奋、羞涩
基础运镜 固定镜头、横移、纵移、跟拍、摇镜、升降镜头
高级运镜 推轨(Dolly)、变焦(Zoom)、希区柯克变焦、手持镜头、第一人称视角(POV)、盗梦空间式旋转

第六章:风格化表现词典

为你的视频注入独一无二的视觉灵魂。

类别 关键词
视觉风格 电影感、纪录片风格、动漫风格、写实风格、水墨风、油画风、赛博朋克、废土风格、蒸汽波、极简主义
特效镜头 慢动作、延时摄影、子弹时间、光晕效果、镜头光晕、散景、动态模糊、颗粒感、鱼眼畸变
相关推荐
人工智能AI技术1 小时前
跨域基础:浏览器同源策略与解决方案
人工智能
醇氧1 小时前
用 CC Switch (cc-sw) 配置 Claude Code 接入 阿里云百炼 (Dashscope)
人工智能·学习·阿里云·ai·云计算
树獭非懒1 小时前
Harness Engineering:为什么你的 AI 不好用,其实不是模型的问题
人工智能·程序员·llm
晨欣1 小时前
LLM 推理性能指标全解:TTFT、TBT、Output Speed、Throughput、SLO 怎么用(GPT-5.4-high生成)
人工智能·gpt·llm
阿洛学长1 小时前
2026年最佳AI提示词合集:ChatGPT、Claude、Gemini 提示词大全
人工智能·ai·chatgpt·ai作画
寂寞旅行1 小时前
模型蒸馏: 小模型也有“大用“
人工智能·embedding
东离与糖宝1 小时前
Python 包结构基础:init.py 作用
人工智能
财迅通Ai9 小时前
商业航天概念领涨A股,航天ETF华安(159267.SZ)收盘上涨1.2%
大数据·人工智能·区块链·中国卫星·航天电子
齐齐大魔王10 小时前
智能语音技术(八)
人工智能·语音识别
许彰午10 小时前
零成本搭建RAG智能客服:Ollama + Milvus + DeepSeek全程实战
人工智能·语音识别·llama·milvus