用ffmpeg对视频添加语音、背景音乐和字幕的方法

先看代码:

bash 复制代码
ffmpeg.exe ^
-i "D:/test/video.mp4" ^
-i "D:/test/voice.mp3" ^
-i "D:/test/music.mp3" ^
-i "D:/test/voice.srt" ^
-filter_complex "[1:a]volume=1.0,asetpts=PTS-STARTPTS[a_voice];[2:a]volume=0.5,asetpts=PTS-STARTPTS[a_music];[a_voice][a_music]amix=inputs=2:duration=first[audio_mixed];[0:v]subtitles='D\:/test/voice.srt':force_style='Fontsize=24,Fontcolor=white'[vout]" ^
-map "[vout]" ^
-map "[audio_mixed]" ^
-c:v libx264 -crf 23 -preset veryfast -c:a aac -b:a 128k ^
-disposition:a:0 default ^
"D:/test/output_final.mp4"
以上代码成功完成了添加语音、背景音乐和字幕,完美。

再看解释:

这个复杂滤镜链由多个部分组成,用分号(;)分隔,每个部分负责处理不同的输入流或组合它们。

调整语音音量及时间戳:

  • 1:a\]volume=1.0,asetpts=PTS-STARTPTS\[a_voice

    1:a\] 指的是第二个输入文件(voice.mp3)的音频部分。 volume=1.0 设置音量为原始音量的100%(无增减)。 asetpts=PTS-STARTPTS 重置音频的时间戳,确保与视频同步。 最后 \[a_voice\] 是这个处理后的音频流的标签。 调整背景音乐音量及时间戳:

    类似地,处理第三个输入文件(music.mp3)的音频。

    volume=0.5 将音量设置为原始的一半。

    同样使用asetpts重置时间戳。

    a_music\] 标记处理后的音频流。 音频混合:

    a_voice\] 和 \[a_music\] 被送入amix滤镜进行混合。 inputs=2 指明有两个输入流参与混合。 duration=first 确保混合后的音频长度与第一个输入(\[a_voice\])相同,这样如果voice.mp3的长度与视频匹配,则音频不会过长。 字幕叠加到视频:

    0:v\] 表示第一个输入文件(video.mp4)的视频流。 subtitles='D:/test/voice.srt' 将指定的SRT字幕文件叠加到视频上。 force_style='Fontsize=24,Fontcolor=white' 设置字幕样式:字体大小为24,颜色为白色。 \[vout\] 标签表示处理后的视频流,包含叠加了字幕的视频。

    -map "[vout]" -map "[audio_mixed]" 指定最终输出使用哪些流:处理过的视频流[vout]和混合后的音频流[audio_mixed]。

    -t $(ffprobe ...) 动态获取视频的时长,并将其作为输出的持续时间,确保输出与源视频时长相符。

    其余参数涉及视频和音频的编码设置,如使用H.264编码器(-c:v libx264)、CRF值(-crf 23)、预设(-preset veryfast)、AAC音频编码(-c:a aac)和音频比特率(-b:a 128k)等,用于控制输出文件的质量和兼容性。

综上所述,这段命令通过精细的音频处理和视频字幕叠加,实现了按照video.mp4的时长来输出一个包含调整音量的语音、背景音乐和字幕的最终视频文件。

相关推荐
EasyDSS1 小时前
视频高清直播点播/智能会议管理系统EasyDSS优化升级提升视频会议协作体验
音视频
DogDaoDao2 小时前
AV1 环路滤波器深度解析:av1_loopfilter.c 源码原理详解
音视频·实时音视频·视频编解码·av1·vp9·libaom·环路滤波
ZC跨境爬虫3 小时前
跟着MDN学HTML_day_47:(Document接口)
前端·javascript·ui·html·ecmascript·音视频
YuxuanSys-Regen3 小时前
WMMAV&YUXUANSYS/育轩:Dante主机接入手持发射器:让会议音频进入“无线高保真”时代
音视频·腾讯会议·teams·dante·无线手持·音频设备
kcuwu.3 小时前
博客转抖音视频(文件上传版)Coze工作流实现文档(第一版)
人工智能·音视频·coze
沙振宇4 小时前
【Python】使用YOLO8识别视频中的车与人物
python·yolo·音视频·状态模式·识别
开开心心就好5 小时前
支持添加网址的资源快速打开工具
人工智能·学习·游戏·音视频·hbase·语音识别·storm
AI搅拌机18 小时前
LTX2.3 IC-LORA动作迁移,通过depth、POSE、Canny精准控制生成的视频!
人工智能·音视频
蒋胜山18 小时前
PowerPoint插入音频报错
windows·经验分享·音视频
byte轻骑兵19 小时前
【LE Audio】CAP精讲[5]: 导演上线!Initiator音频协同全流程合规指南
人工智能·音视频·低功耗·le audio