PCM音频混合的方法

音频混音算法的实现

1、线性叠加后求平均

优点:不会产生溢出,噪音较小;

缺点:衰减过大,影响通话质量;

cpp 复制代码
    short  remix(short buffer1,short buffer2)  
    {  
        int value = buffer1 + buffer2;  
        return (short)(value/2);  
    } 

2、归一化混音(自适应加权混音算法)

思路:使用更多的位数(32 bit)来表示音频数据的一个样本,混完音后在想办法降低其振幅,使其仍旧分布在16 bit所能表示的范围之内,这种方法叫做归一法;

方法:为避免发生溢出,使用一个可变的衰减因子对语音进行衰减。这个衰减因子也就代表语音的权重,衰减因子随着音频数据的变化而变化,所以称为自适应加权混音。当溢出时,衰减因子较小,使得溢出的数据在衰减后能够处于临界值以内,而在没有溢出时,又让衰减因子慢慢增大,使数据较为平缓的变化。

objectivec 复制代码
void mix(char **src_data, char *mix_data, int channels, int buffer_size)  
{  
    //归一化混音  
    int const MAX=32767;  
    int const MIN=-32768;  

    double f=1;  
    int output;  
    int i = 0,j = 0;
    
    
    for (i=0; i < buffer_size / 2; i++)  
	//for (i=0; i < buffer_size; i++)  
    {  
        int temp = 0;  
        for (j = 0; j < channels; j++)  
        {  
            //两个文件对应音轨值相加
            temp += *(short*)(src_data[j] + i * 2);  
        }
        
        output = (int)(temp*f); 
         
        if (output > MAX)  
        {  
            f = (double)MAX / (double)(output);  
            output = MAX;  
        }  
        if (output < MIN)  
        {  
            f = (double)MIN / (double)(output);  
            output = MIN;  
        }
        if (f < 1)  
        {  
            f += ((double)1 - f) / (double)32;  
        }
        
        *(short*)(mix_data + i * 2) = (short)output;  
    }  
}  

3、PCM脉冲编码的音频信号的混音实现,

objectivec 复制代码
#define WIDEN_TEMP_TYPE int	
#define AUDIO_DATA_TYPE short
#define AUDIO_DATA_TYPE_MAX 32767	// 2^15(short)
#define AUDIO_DATA_TYPE_MIN -32768
void mix1(char **src_data, char *mix_data, int channels, int buffer_size)  
{  
// 初始化中间变量
	WIDEN_TEMP_TYPE tempMul = 1;
	WIDEN_TEMP_TYPE tempSum = 0;
	WIDEN_TEMP_TYPE mixedTempData;
	int howManyPointsArePos = 0;

	int sz = channels;
	int i = 0;
	int j = 0;
	for ( i = 0; i < buffer_size / 2; ++i)
	{
		// 复位中间变量
		tempMul = 1;
		tempSum = 0;

		// 求中间变量
		howManyPointsArePos = 0;								// 统计每个点是不是都是正数
		for ( j = 0; j < sz; ++j)
		{
			tempMul *= *(short*)(src_data[j] + i * 2); 
			tempSum += *(short*)(src_data[j] + i * 2); 

			if (*(short*)(src_data[j] + i * 2) < 0)
				++howManyPointsArePos;
		}

		// 混音
		if (howManyPointsArePos == sz)
			mixedTempData = tempSum - (tempMul / -(pow(2, 16 - 1) - 1));
		else
			mixedTempData = tempSum - (tempMul / (pow(2, 16 - 1) - 1));

		// 防止上下溢出
		if (mixedTempData > AUDIO_DATA_TYPE_MAX)
			mixedTempData = AUDIO_DATA_TYPE_MAX;
		else if (mixedTempData < AUDIO_DATA_TYPE_MIN)
			mixedTempData = AUDIO_DATA_TYPE_MIN;

		*(short*)(mix_data + i * 2) = (short)mixedTempData;  

	}
}  
相关推荐
顾道长生'2 小时前
(Arxiv-2025)通过动态 token 剔除实现无需训练的高效视频生成
计算机视觉·音视频·视频生成
每次的天空10 小时前
Android-自定义View的实战学习总结
android·学习·kotlin·音视频
爱分享的飘哥11 小时前
【V6.0 - 听觉篇】当AI学会“听”:用声音特征捕捉视频的“情绪爽点”
人工智能·音视频
菜包eo12 小时前
二维码驱动的独立站视频集成方案
网络·python·音视频
阿蒙Amon15 小时前
【Python小工具】使用 OpenCV 获取视频时长的详细指南
python·opencv·音视频
aqi0017 小时前
FFmpeg开发笔记(七十一)使用国产的QPlayer2实现双播放器观看视频
android·ffmpeg·音视频·流媒体
正在走向自律19 小时前
第二章-AIGC入门-开启AIGC音频探索之旅:从入门到实践(6/36)
人工智能·aigc·音视频·语音识别·ai音乐·ai 音频·智能语音助手
美狐美颜sdk1 天前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
melonbo1 天前
使用FFmpeg将H.264码流封装为MP4
ffmpeg·音视频·h.264
aqi001 天前
FFmpeg开发笔记(七十七)Android的开源音视频剪辑框架RxFFmpeg
android·ffmpeg·音视频·流媒体