用ffmpeg对视频添加语音、背景音乐和字幕的方法

先看代码:

bash 复制代码
ffmpeg.exe ^
-i "D:/test/video.mp4" ^
-i "D:/test/voice.mp3" ^
-i "D:/test/music.mp3" ^
-i "D:/test/voice.srt" ^
-filter_complex "[1:a]volume=1.0,asetpts=PTS-STARTPTS[a_voice];[2:a]volume=0.5,asetpts=PTS-STARTPTS[a_music];[a_voice][a_music]amix=inputs=2:duration=first[audio_mixed];[0:v]subtitles='D\:/test/voice.srt':force_style='Fontsize=24,Fontcolor=white'[vout]" ^
-map "[vout]" ^
-map "[audio_mixed]" ^
-c:v libx264 -crf 23 -preset veryfast -c:a aac -b:a 128k ^
-disposition:a:0 default ^
"D:/test/output_final.mp4"
以上代码成功完成了添加语音、背景音乐和字幕,完美。

再看解释:

这个复杂滤镜链由多个部分组成,用分号(;)分隔,每个部分负责处理不同的输入流或组合它们。

调整语音音量及时间戳:

  • 1:a\]volume=1.0,asetpts=PTS-STARTPTS\[a_voice

    1:a 指的是第二个输入文件(voice.mp3)的音频部分。

    volume=1.0 设置音量为原始音量的100%(无增减)。

    asetpts=PTS-STARTPTS 重置音频的时间戳,确保与视频同步。

    最后 a_voice 是这个处理后的音频流的标签。

    调整背景音乐音量及时间戳:

  • 2:a\]volume=0.5,asetpts=PTS-STARTPTS\[a_music

    类似地,处理第三个输入文件(music.mp3)的音频。

    volume=0.5 将音量设置为原始的一半。

    同样使用asetpts重置时间戳。

    a_music 标记处理后的音频流。

    音频混合:

  • a_voice\]\[a_music\]amix=inputs=2:duration=first\[audio_mixed

    a_voicea_music 被送入amix滤镜进行混合。

    inputs=2 指明有两个输入流参与混合。

    duration=first 确保混合后的音频长度与第一个输入(a_voice)相同,这样如果voice.mp3的长度与视频匹配,则音频不会过长。

    字幕叠加到视频:

  • 0:v\]subtitles='D:/test/voice.srt':force_style='Fontsize=24,Fontcolor=white'\[vout

    0:v 表示第一个输入文件(video.mp4)的视频流。

    subtitles='D:/test/voice.srt' 将指定的SRT字幕文件叠加到视频上。

    force_style='Fontsize=24,Fontcolor=white' 设置字幕样式:字体大小为24,颜色为白色。

    vout 标签表示处理后的视频流,包含叠加了字幕的视频。

  • 其他重要参数

    -map "vout" -map "audio_mixed" 指定最终输出使用哪些流:处理过的视频流vout和混合后的音频流audio_mixed

    -t $(ffprobe ...) 动态获取视频的时长,并将其作为输出的持续时间,确保输出与源视频时长相符。

    其余参数涉及视频和音频的编码设置,如使用H.264编码器(-c:v libx264)、CRF值(-crf 23)、预设(-preset veryfast)、AAC音频编码(-c:a aac)和音频比特率(-b:a 128k)等,用于控制输出文件的质量和兼容性。

综上所述,这段命令通过精细的音频处理和视频字幕叠加,实现了按照video.mp4的时长来输出一个包含调整音量的语音、背景音乐和字幕的最终视频文件。

相关推荐
昨日之日20063 小时前
Higgs Audio v3 - 超自然多语言情感TTS,一键克隆声音 一键整合包下载
人工智能·音视频
ltlovezh5 小时前
ROI 编码学习指南:Android 与 FFmpeg 的真实实现边界
android·ffmpeg·音视频开发
声光界6 小时前
《星闪无线短距通信使能智能音频》
音视频
吾名招财7 小时前
视频+全景视频多视角快速抽帧工具(可免费使用)
音视频·视频抽帧·全景视频
王木风7 小时前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
学编程的小程9 小时前
以前做视频靠时间,现在做视频靠提示词——Codex+Remotion体验记
音视频
鸽芷咕9 小时前
鸿蒙PC迁移:MoonPlayer Qt 视频播放器鸿蒙PC适配全记录
qt·音视频·harmonyos
qq_4221525712 小时前
视频转 GIF 工具怎么选?2026 年动图制作方案与画质参数对比
javascript·vue.js·音视频
byte轻骑兵12 小时前
【LE Audio】CAS精讲[2]: 服务核心规则,落地音频设备的标准化标识
人工智能·音视频·le audio·低功耗音频·车机蓝牙
wen_zhufeng12 小时前
AudioX\-Turbo:面向通用音频生成的高效多模态统一框架
人工智能·算法·音视频