ffmpeg使用amix混合多个音频时音量变小或音量不一致问题

背景

最近工作中遇到一个音频混合后,导出文件播放音量不一致问题。

问题描述

例如,7个音频混合起来,发现第一个音频的音量变得很小,第2个稍大一点,直到第7个最大(等于原音频)。

bash 复制代码
ffmpeg -i 24281_1.mp3 -i 24281_2.mp3 -i 24281_3.mp3 -i 24281_4.mp3 \
	-i 24281_5.mp3 -i 24281_6.mp3 -i 24281_7.mp3 \
	-filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a][6:a]amix=inputs=7:duration=longest[Audio]"  \
	-map "[Audio]" -acodec mp3 -y amix.mp3

结果amix.mp3的音量是一开始最小,逐渐变大,直到最后一段变成和源文件一样大。

原因分析

尝试了多种方法无法解决。最终发现stackover关于该问题有一个讨论:stackoverflow

知乎也有人讨论过:如何解决FFmpeg合并多个音频并解决声音变小的问题? - JJ Chan的回答 - 知乎

这个是因为ffmpeg叠加音频的机制导致的。使用amix的时候每个引入的视频会以1/n的音量播放,其中n是活动的inputs的数量。例如一共18个音频的话,这时候处理第一个音频的时候就是一共有18个活动的inputs,音频会以1/18的音量播放。处理第二个的时候,第一个音频已经不活动了, 就剩17个inputs,音频会以1/17的音量播放。所以导致越到后面的声音越大。

解决方法

方法1

知道了原因,可以把amix 缩小的声音给放大回来,修改上面的命令:

bash 复制代码
ffmpeg -i 24281_1.mp3 -i 24281_2.mp3 -i 24281_3.mp3 -i 24281_4.mp3 \
	-i 24281_5.mp3 -i 24281_6.mp3 -i 24281_7.mp3 \
	-filter_complex "\
		[0:a]volume=7[a0];\
		[1:a]volume=6[a1];\
		[2:a]volume=5[a2];\
		[3:a]volume=4[a3];\
		[4:a]volume=3[a4];\
		[5:a]volume=2[a5];\
		[6:a]volume=1[a6];\
		[a0][a1][a2][a3][a4][a5][a6]amix=inputs=7:duration=longest[Audio]"  \
	-map "[Audio]" -acodec mp3 -y amix.mp3

方法2

据stackoverflow讨论,新版本FFmpeg支持在amix时指定normalize=0以取消默认的音量缩小行为。

经过尝试,该参数在FFmpeg v4.3上不存在,FFmpeg v6.0上可用。

bash 复制代码
ffmpeg -i 24281_1.mp3 -i 24281_2.mp3 -i 24281_3.mp3 -i 24281_4.mp3 \
	-i 24281_5.mp3 -i 24281_6.mp3 -i 24281_7.mp3 \
	-filter_complex "[0:a][1:a][2:a][3:a][4:a][5:a][6:a]amix=inputs=7:duration=longest:normalize=0[Audio]"  \
	-map "[Audio]" -acodec mp3 -y amix.mp3

总结

FFmpeg使用amix进行音频混合时,默认行为是缩减每个音频,这容易让人忽略掉。虽然最新版本FFmpeg提供了参数normalize=0来屏蔽掉这个默认行为,但老版本FFmpeg还是只能手动调整音量。

相关推荐
小鹿研究点东西9 小时前
直播带货长视频AI自动剪辑开播:一场直播如何反复利用?
ffmpeg·自动化·音视频·语音识别
换个昵称都难9 小时前
webrtc PeerConnection 模块介绍
音视频·webrtc
潜创微科技10 小时前
4K60 over IP 方案简介
网络·嵌入式硬件·网络协议·tcp/ip·音视频
超哥--11 小时前
B站视频内容智能分析系统(三):B站视频自动采集
java·开发语言·音视频·ai编程
localbob17 小时前
日语视频 SRT 字幕生成软件下载:日语视频本地自动翻译SRT字幕生成、日语视频自动翻译 Faster Whisper v1.7 下载与使用教程(含AMD显卡支持)
whisper·音视频·机器翻译·日语字幕翻译·日语视频翻译·本地ai翻译日语视频
音乐宝贝家19 小时前
吉他桶型技术解析:GA桶 vs D桶 vs OM桶——入门弹唱选哪个
新媒体运营·音视频·业界资讯·媒体·材质·零售·内容运营
luoyayun36119 小时前
Qt + FFmpeg 实战:获取音视频文件基础属性、流信息和元数据
qt·ffmpeg·音视频·元数据·获取音视频文件属性
Rudon滨海渔村19 小时前
ffmpeg裁剪视频黑屏、不准时等处理方式 - ffmpeg基本操作
ffmpeg·音视频
谁刺我心20 小时前
[QtCPP]Examples使用示例-QtMultimedia、QMediaPlayer、Audio音频引擎测试mp3播放
qt·音视频·qml
FFZero120 小时前
[mpv脚本系统] (五) C层系统调用的实现: mpv client通信机制
c语言·音视频