PCM音频混合的方法

音频混音算法的实现

1、线性叠加后求平均

优点:不会产生溢出,噪音较小;

缺点:衰减过大,影响通话质量;

cpp 复制代码
    short  remix(short buffer1,short buffer2)  
    {  
        int value = buffer1 + buffer2;  
        return (short)(value/2);  
    } 

2、归一化混音(自适应加权混音算法)

思路:使用更多的位数(32 bit)来表示音频数据的一个样本,混完音后在想办法降低其振幅,使其仍旧分布在16 bit所能表示的范围之内,这种方法叫做归一法;

方法:为避免发生溢出,使用一个可变的衰减因子对语音进行衰减。这个衰减因子也就代表语音的权重,衰减因子随着音频数据的变化而变化,所以称为自适应加权混音。当溢出时,衰减因子较小,使得溢出的数据在衰减后能够处于临界值以内,而在没有溢出时,又让衰减因子慢慢增大,使数据较为平缓的变化。

objectivec 复制代码
void mix(char **src_data, char *mix_data, int channels, int buffer_size)  
{  
    //归一化混音  
    int const MAX=32767;  
    int const MIN=-32768;  

    double f=1;  
    int output;  
    int i = 0,j = 0;
    
    
    for (i=0; i < buffer_size / 2; i++)  
	//for (i=0; i < buffer_size; i++)  
    {  
        int temp = 0;  
        for (j = 0; j < channels; j++)  
        {  
            //两个文件对应音轨值相加
            temp += *(short*)(src_data[j] + i * 2);  
        }
        
        output = (int)(temp*f); 
         
        if (output > MAX)  
        {  
            f = (double)MAX / (double)(output);  
            output = MAX;  
        }  
        if (output < MIN)  
        {  
            f = (double)MIN / (double)(output);  
            output = MIN;  
        }
        if (f < 1)  
        {  
            f += ((double)1 - f) / (double)32;  
        }
        
        *(short*)(mix_data + i * 2) = (short)output;  
    }  
}  

3、PCM脉冲编码的音频信号的混音实现,

objectivec 复制代码
#define WIDEN_TEMP_TYPE int	
#define AUDIO_DATA_TYPE short
#define AUDIO_DATA_TYPE_MAX 32767	// 2^15(short)
#define AUDIO_DATA_TYPE_MIN -32768
void mix1(char **src_data, char *mix_data, int channels, int buffer_size)  
{  
// 初始化中间变量
	WIDEN_TEMP_TYPE tempMul = 1;
	WIDEN_TEMP_TYPE tempSum = 0;
	WIDEN_TEMP_TYPE mixedTempData;
	int howManyPointsArePos = 0;

	int sz = channels;
	int i = 0;
	int j = 0;
	for ( i = 0; i < buffer_size / 2; ++i)
	{
		// 复位中间变量
		tempMul = 1;
		tempSum = 0;

		// 求中间变量
		howManyPointsArePos = 0;								// 统计每个点是不是都是正数
		for ( j = 0; j < sz; ++j)
		{
			tempMul *= *(short*)(src_data[j] + i * 2); 
			tempSum += *(short*)(src_data[j] + i * 2); 

			if (*(short*)(src_data[j] + i * 2) < 0)
				++howManyPointsArePos;
		}

		// 混音
		if (howManyPointsArePos == sz)
			mixedTempData = tempSum - (tempMul / -(pow(2, 16 - 1) - 1));
		else
			mixedTempData = tempSum - (tempMul / (pow(2, 16 - 1) - 1));

		// 防止上下溢出
		if (mixedTempData > AUDIO_DATA_TYPE_MAX)
			mixedTempData = AUDIO_DATA_TYPE_MAX;
		else if (mixedTempData < AUDIO_DATA_TYPE_MIN)
			mixedTempData = AUDIO_DATA_TYPE_MIN;

		*(short*)(mix_data + i * 2) = (short)mixedTempData;  

	}
}  
相关推荐
ai产品老杨5 小时前
异构计算时代的视频底座:基于 ZLMediaKit 与 Spring Boot 的 X86/ARM 跨平台架构解析
arm开发·spring boot·音视频
Black蜡笔小新8 小时前
花屏/蓝屏/黑屏/画面抖动/冻结/模糊检测,聊聊EasyCVR的视频质量诊断插件,解决运维人的实际烦恼
运维·音视频
琪伦的工具库8 小时前
批量音频音量调整工具使用说明:固定增减分贝与目标响度两种模式怎么选
音视频
y小花8 小时前
安卓音频子系统之USBAlsaManager
android·音视频
AI2512249 小时前
2026年9款主流AI视频生成器功能评测
人工智能·音视频
2401_885885049 小时前
视频短信二次开发接口怎么做?视频短信API发送教程
音视频
2401_885885049 小时前
视频短信第三方接口好开发吗?全国三网覆盖能力的视频短信平台
音视频
hay_lee10 小时前
匿名屠榜,阿里认领:HappyHorse 1.0 如何重写AI视频生成规则?
人工智能·音视频
ai产品老杨12 小时前
打破品牌孤岛:基于 GB28181 与 ZLMediaKit 的多协议视频统一接入网关架构
架构·音视频
视***间12 小时前
智采高清,视界无界——视程空间视频采集卡,定义专业采集新标杆
人工智能·机器人·音视频·边缘计算·采集卡·视程空间·视频采集卡