webrtc ns 降噪之粉红噪声参数推导

webrtc中降噪中,前50帧需要进行简单噪声估计,使用白噪声和粉红噪声模型估算。

首先我们 复习 有色噪声(包含白噪声)的一般模型:

  • S(f) 是频率 f 处的功率谱密度。
  • f是频率。
  • α 是一个频谱指数,通常在1左右。

写成一般形式是 log(S) = - alpha* log (f) + log(C)

这两个参数是我们需要估算的, alpha 是零的时候退化成白噪声

再看下面的webrtc 源代码 ns_core.c

源代码中的 parametricNoise = parametric_num / i ^ parametric_exp

其实就是 S = C / f ^alpha , 其中f 和i 有个比率关系 f = i * fs/N , 常数比例,你可以认为,估算的时候全部塞到 C里面了

下面我们开始估算 self->pinkNoiseNumerator 和 self->pinkNoiseExp

需要用到的有:sum_log_i 和 sum_log_magn 这几个表达式比较难看,我们还是用x和y来表示

x = log(i) , y = log(magn)

现在得到了一组 y 和 x 的关系 上面说到了 log(magn) 和 log(i) 是线性关系

也就是 y = k * x + b, 要估算 k(斜率) 和 b(截距)

立刻用 GPT 调出来 一元线性回归的 方程 参数估计:

现在计算beta0,也就是截距:把beta1带入到上面,得到

原来的分母是n,

好了现在总结如下:

斜率:

截距:

现在带着你,手拉手的和代码对齐!

这个用在分母上,所有有个相反数

一句话总结:原来使用了线性回归(最小二乘)来拟合参数啊!

粉红噪声的意义更大,因为笔者认为,大多数场合下,不会刚好满足白噪声的条件

所以大多数是按照下面那个分支来的, 更通用,(包含白噪声的情况)

另外,再补充一下:一般有色噪声的介绍:

2.5: Noise Modeling - White, Pink, and Brown Noise, Pops and Crackles - Engineering LibreTexts

白噪声本模型能搞定,OK

粉红:

恰好是 1/f 的,(狭义or严格的粉红是正比 1/f 系数是1)

褐噪

看到了么?beta=2 是 褐噪,也是可以handle的

下面是蓝噪

蓝色噪声,beta 是负数,其实我们也可以满足,对吗?

下面是紫噪

紫色噪声,也是可以满足的,对吗?

哇,我们分析了几乎所有的color noise,模型都是可以满足的,那么其实 webrtc种的pinknoise 参数估计应该叫color noise 估计,对吗? 评论区留下你的观点。

红,粉红,白,褐色,蓝色,紫色

2 1 0 2 -1 -2

相关推荐
任小栗14 小时前
【实战干货】Vue3 + WebRTC + SIP + AI 实现全自动语音接警系统(远程流获取+实时ASR+TTS回播)
人工智能·webrtc
runner365.git1 天前
如何使用RTCPilot--跨平台WebRTC开源服务
webrtc·音视频开发
runner365.git1 天前
RTC实现VoiceAgent(二)
大模型·webrtc·实时音视频·voiceagent
runner365.git2 天前
WebRTC实现VoiceAgent智能体
webrtc
runner365.git2 天前
RTCPilot的信令流程
webrtc·音视频开发
runner365.git2 天前
如何使用RTCPilot配置一个集群RTC服务
webrtc·实时音视频·音视频开发
深念Y3 天前
从WebSocket到WebRTC,豆包级实时语音交互背后的技术演进
websocket·网络协议·实时互动·webrtc·语音识别·实时音视频
AI视觉网奇5 天前
webrtc 硬编码
ffmpeg·webrtc
REDcker5 天前
WebRTC 接收端音频流畅低延迟播放:原理与源码对照(NetEQ / Opus)
音视频·webrtc
SUNNY_SHUN5 天前
LiveKit Agents:基于WebRTC的实时语音视频AI Agent框架(9.9k Star)
人工智能·github·webrtc