用ffmpeg对视频添加语音、背景音乐和字幕的方法

先看代码:

bash 复制代码
ffmpeg.exe ^
-i "D:/test/video.mp4" ^
-i "D:/test/voice.mp3" ^
-i "D:/test/music.mp3" ^
-i "D:/test/voice.srt" ^
-filter_complex "[1:a]volume=1.0,asetpts=PTS-STARTPTS[a_voice];[2:a]volume=0.5,asetpts=PTS-STARTPTS[a_music];[a_voice][a_music]amix=inputs=2:duration=first[audio_mixed];[0:v]subtitles='D\:/test/voice.srt':force_style='Fontsize=24,Fontcolor=white'[vout]" ^
-map "[vout]" ^
-map "[audio_mixed]" ^
-c:v libx264 -crf 23 -preset veryfast -c:a aac -b:a 128k ^
-disposition:a:0 default ^
"D:/test/output_final.mp4"
以上代码成功完成了添加语音、背景音乐和字幕,完美。

再看解释:

这个复杂滤镜链由多个部分组成,用分号(;)分隔,每个部分负责处理不同的输入流或组合它们。

调整语音音量及时间戳:

  • 1:a\]volume=1.0,asetpts=PTS-STARTPTS\[a_voice

    1:a\] 指的是第二个输入文件(voice.mp3)的音频部分。 volume=1.0 设置音量为原始音量的100%(无增减)。 asetpts=PTS-STARTPTS 重置音频的时间戳,确保与视频同步。 最后 \[a_voice\] 是这个处理后的音频流的标签。 调整背景音乐音量及时间戳:

    类似地,处理第三个输入文件(music.mp3)的音频。

    volume=0.5 将音量设置为原始的一半。

    同样使用asetpts重置时间戳。

    a_music\] 标记处理后的音频流。 音频混合:

    a_voice\] 和 \[a_music\] 被送入amix滤镜进行混合。 inputs=2 指明有两个输入流参与混合。 duration=first 确保混合后的音频长度与第一个输入(\[a_voice\])相同,这样如果voice.mp3的长度与视频匹配,则音频不会过长。 字幕叠加到视频:

    0:v\] 表示第一个输入文件(video.mp4)的视频流。 subtitles='D:/test/voice.srt' 将指定的SRT字幕文件叠加到视频上。 force_style='Fontsize=24,Fontcolor=white' 设置字幕样式:字体大小为24,颜色为白色。 \[vout\] 标签表示处理后的视频流,包含叠加了字幕的视频。

    -map "[vout]" -map "[audio_mixed]" 指定最终输出使用哪些流:处理过的视频流[vout]和混合后的音频流[audio_mixed]。

    -t $(ffprobe ...) 动态获取视频的时长,并将其作为输出的持续时间,确保输出与源视频时长相符。

    其余参数涉及视频和音频的编码设置,如使用H.264编码器(-c:v libx264)、CRF值(-crf 23)、预设(-preset veryfast)、AAC音频编码(-c:a aac)和音频比特率(-b:a 128k)等,用于控制输出文件的质量和兼容性。

综上所述,这段命令通过精细的音频处理和视频字幕叠加,实现了按照video.mp4的时长来输出一个包含调整音量的语音、背景音乐和字幕的最终视频文件。

相关推荐
sweetone4 小时前
安桥CR-245BT 微型桌面音响不开机小修
经验分享·音视频
EasyGBS5 小时前
花屏蓝屏画面模糊画面冻结检测...国标GB28181视频分析平台EasyGBS视频质量诊断助力城市公共区域监控“看得清、管得好”
音视频
悢七5 小时前
单机部署 OceanBase 集群
数据库·ffmpeg·oceanbase
yy我不解释9 小时前
关于FFmpeg的安装使用(m3u8转码MP4)
ffmpeg
余道各努力,千里自同风10 小时前
视频自动播放带声音
音视频
AI服务老曹11 小时前
打破品牌孤岛:基于 GB28181 与 RTSP 协议融合的 AI 视频中台架构解析
人工智能·架构·音视频
Fleshy数模12 小时前
玩转OpenCV DNN模块:实现图片与实时视频风格迁移
opencv·音视频·dnn
飞易通12 小时前
Realtek RTL8761CTV 集成蓝牙5.3 LE Audio 双模音频方案覆盖多场景无线应用
音视频·ble·le audio·蓝牙5.3·realtek
春末的南方城市12 小时前
AI 首次实现电影级多镜头长视频生成!快手&港中文开源ShotStream,可实现单NVIDIA GPU上可达16 FPS 互式故事讲述和高效即时帧生成。
人工智能·音视频