如何修改音频的音量增益

一、前言

在开发音频相关的功能(比如说语音通话、播放音乐)时,经常会遇到音量太小的问题,这时候就需要我们对原始数据进行处理。本文将介绍如何通过修改原始音频数据来增加增益,本文包含如下内容:

1.音频数据在软件上的形态

2.音频增益计算公式

3.修改音频增益的代码实现

二、音频数据在软件上的形态

声音在自然界是以模拟信号的形式存在的,为了便于传输和存储,电子设备通常会将声音转成电信号。每个采集到的电信号在软件上都会对应一个数值,软件上通过对这些数值进行处理,最终实现对音频的调整。

软件上通常使用十六进制来表示音频对应的电信号数值,如下图所示:

(2-1)

音频采样的频率越高、位深越大,就越音频能够还原原始的音频。位深越大,音频样本的分辨率就越高。常用的有8bit、16bit、24bit、32bit。

三、音频增益计算公式

声音的大小通常用分贝(dB)来衡量。

在软件上,可以通过同意提供每个采样点的值来增加音频的增益,不过这种方式不太好量化修改后的具体增益。

软件上常使用对原始音频数据进行移位的方式修改音频的增益,这种方式位移数和增益(dB)的数学关系如下:

Gain(dB)= 20 * log10 (2的n次方) (n为位移数)

= 6.02 * n

也就是说,原始数据左移一位,增加6.02个dB。(右移则减小)

四、修改音频增益的代码实现

假定系统中播放的音频数据是16位深小端存储的(低位在前,高位在后),且数据是2通道的,修改音频增益的代码实现应如下所示:

c 复制代码
void change_gain(char *buf, snd_pcm_uframes_t frames, int seek)
                    
{
        //1frame的数据大小为:通道数 * 16/8 = 2 * 2(Byte)            
        int length = frames * 4;
                                        
        for(int i = 0; i < length - 1; i += 2)
                    
        {
                //将两个8bit的数据组合成完整的16bit数据    
                unsigned short value = (buf[i] & 0xFF) | ((buf[i + 1] & 0xFF) << 8);
                //移位修改增益                        
                value <<= seek;
                //获取低8位数据                        
                buf[i] = (value & 0xFF);
                //获取高8为数据    
                buf[i + 1] = (value >> 8) & 0xFF;
                    
        }
                                        
}

这里取向左移动3位,理论上会增加18.06个dB,最后的测试数据如下:

修改前的数据:

(4-1)

修改后的数据:

(4-2)

修改前后数据相差也在18dB左右,说明修改成功了。

相关推荐
REDcker3 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19983 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君3 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥3 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276423 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk3 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS3 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276423 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838683 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川3 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频