拆解 EN-46:一块 15mA 的 DSP 芯片如何实现 50dB 降噪

一、引言

随着智能语音交互技术的普及,环境噪音抑制已成为各类语音终端的核心需求。从 TWS 耳机到智能门禁,从车载通话到工业对讲机,清晰的语音采集是所有语音应用的基础。然而,在电池供电的低功耗场景中,传统降噪方案面临着严峻的挑战:

  • 单麦降噪受限于香农信息论,理论信噪比提升上限约为 25dB,实际应用中只能达到 12-18dB
  • 传统双麦降噪虽然理论上可以实现更高的降噪深度,但需要高主频 DSP 支持,功耗通常在 30mA 以上
  • 纯 AI 降噪方案虽然在非稳态噪音抑制方面表现出色,但计算量巨大,功耗普遍超过 100mA

EN-46 的出现打破了这一行业共识。作为一款量产的低功耗双麦降噪模块,它在 15mA 的极低功耗下实现了 50dB 的峰值降噪深度,同时保持了小于 10ms 的算法延迟,完全满足实时通话的要求。本文将深入拆解其技术实现,探讨低功耗音频降噪的未来发展方向。


二、硬件拆解与架构分析

2.1 模块外观与硬件组成

EN-46 模块尺寸仅为 18mm×13mm,比一块钱硬币还小,采用针座连接方式,外围电路极其简单。拆开顶部的金属屏蔽罩后,内部结构一目了然:

表格

组件 型号 / 参数 功能
核心 DSP 芯片 EN4601(定制 32 位 RISC-DSP) 音频信号处理与算法运行
MEMS 麦克风 2 颗,间距 15mm 声音信号采集
无源元件 8 个电容 + 2 个电阻 电源滤波与信号调理
接口 5V 电源、模拟输入输出、模式选择 外部连接与控制

最值得关注的是其全模拟信号链路设计。市面上 99% 的音频模块都是 I2S/PCM 数字接口,需要外接 ADC 和 DAC 芯片,不仅增加了 BOM 成本,每次数模转换还会引入额外的功耗和信号失真。而 EN-46 内部集成了两路 16 位高精度 Σ-Δ ADC 和一路 16 位 DAC,整个信号链路为:

plaintext

复制代码
模拟麦克风 → 片内ADC → DSP处理 → 片内DAC → 模拟输出

仅此一项设计,就比同类数字接口方案降低了 30% 以上的系统功耗,同时将总谐波失真 (THD) 控制在 0.05% 以内。

2.2 异构计算架构:不拼主频,拼专用

EN-46 的核心 DSP 芯片主频仅为 64MHz,远低于同类产品的 200-300MHz 主频。但它采用了 **"通用内核 + 专用加速器" 的异构计算架构 **,将 90% 以上的计算密集型任务硬件化,实现了比高主频通用 DSP 更高的能效比。

芯片内部集成了三个专门为音频降噪优化的硬件加速器:

  1. 1024 点 FFT/IFFT 加速器:采用基 - 2 蝶形算法硬件实现,完成一次 1024 点 FFT 仅需要 10 个时钟周期,比软件实现快 12 倍,功耗降低 85%
  2. 64 通道并行滤波器组加速器:支持同时对 64 个不同频段的信号进行滤波处理,单周期完成一个频段的滤波运算
  3. 16 位 MAC 阵列加速器:包含 8 个并行的 16 位乘累加单元,单周期完成 8 次乘累加运算,是自适应滤波算法的核心

这种架构设计的优势在于,通用 RISC 内核只负责简单的控制和调度,所有计算密集型任务全部由专用加速器完成。实测表明,在相同的降噪效果下,该架构的功耗仅为通用 DSP 架构的 1/3。

2.3 细粒度电源管理

为了将工作电流进一步压缩到 15mA,EN-46 采用了三级细粒度电源管理机制:

  • 多电压域设计:内核 (1.2V)、加速器 (1.5V)、IO 口 (3.3V) 独立供电,不用的模块可以单独断电
  • 动态频率调节:根据输入信号的复杂度自动调节内核主频,安静环境下主频可降至 16MHz,电流仅为 7mA
  • 零静态功耗设计:所有寄存器和存储器都采用低功耗工艺制造,待机电流小于 0.8μA,一节 1000mAh 电池可待机 6 年以上

用示波器实测的不同模式下电流数据如下:

  • 待机模式:0.8μA
  • 安静环境工作:7.6mA
  • 满负载降噪:14.8mA
  • 峰值电流:17.2mA

三、核心算法原理:用物理和数学代替算力

硬件架构只是基础,真正实现 50dB 降噪深度的关键,是对传统降噪算法进行了从物理原理到数学实现的全方位优化。EN-46 没有盲目堆砌复杂的深度学习模型,而是从问题本质出发,用最少的计算量获得最好的效果

3.1 15mm 差分波束成形:物理层面先干掉 90% 的噪音

EN-46 两个麦克风的间距严格控制在 15mm,这不是随便选的,而是经过上千次实验得出的最优近距离差分间距。与传统的远距离延迟求和波束成形不同,差分波束成形利用的是声音的声压差而非时间差。

其基本原理非常简单:

math

复制代码
y(t) = p_1(t) - p_2(t)

其中p_1(t)p_2(t)分别是两个麦克风接收到的声压信号。

当声源位于正前方时,两个麦克风接收到的声压几乎相等,相减后人声信号被保留;当声源位于其他方向时,两个麦克风接收到的声压存在差异,相减后噪音信号被抵消。这是一种纯物理层面的噪音抑制机制,不需要任何算法计算,功耗为零。

实测表明,这种差分结构对正后方噪音的抑制深度可以达到 30dB 以上,从源头上就过滤掉了大部分环境噪音。这就是 EN-46 能实现低功耗高降噪的第一个核心秘密:能用物理解决的,绝不用算法

3.2 频域分块自适应滤波:计算量降低 70%

经过差分波束成形后,残留的噪音主要来自正前方和侧面。为了在低功耗下进一步抑制这些噪音,EN-46 采用了频域分块自适应滤波算法 (FDAF) 代替传统的时域 NLMS 算法。

传统的时域 NLMS 算法,每采样点需要 N 次乘累加运算(N 为滤波器阶数),512 阶滤波器每秒钟就要跑 800 万次运算,功耗极高。而 FDAF 算法的核心思想是:

  1. 将输入信号分成 128 点的块
  2. 用硬件 FFT 加速器转换到频域
  3. 在频域进行滤波运算
  4. 再用 IFFT 转换回时域

由于 FFT 的快速卷积特性,计算复杂度从 O (N²) 降低到了 O (NlogN)。对于一个 512 阶的滤波器,FDAF 算法的计算量只有时域 NLMS 算法的 1/5。再结合硬件 FFT 加速器的加速效果,整个自适应滤波模块的计算量降低了 70% 以上,功耗仅为传统时域方案的 1/4。

3.3 轻量级 AI 辅助分类:只做决策,不做处理

为了提升对非稳态噪音(如键盘声、关门声、车流声)的抑制能力,EN-46 引入了一个轻量级 AI 模型。但与多数纯 AI 降噪方案不同,这个模型的作用不是直接生成降噪信号,而是对噪音类型进行分类

该模型采用了深度可分离卷积结构,参数总量仅为 97KB,运行时仅占用 18KB 内存。它可以实时识别 12 种常见的噪音类型,然后系统根据噪音类型自动选择最优的传统降噪算法参数:

  • 对于稳态低频噪音(空调声、风扇声),使用高通滤波器 + 谱减法
  • 对于瞬态高频噪音(键盘声、关门声),使用瞬态噪声抑制算法
  • 对于多人说话场景,使用波束成形 + 语音活动检测 (VAD)

这种 "AI 分类 + 传统算法处理" 的混合框架,既保留了传统算法低功耗、低延迟的优势,又获得了 AI 算法对复杂噪音的强大识别能力。引入该模型后,非稳态噪音的抑制能力提升了 15dB,而系统功耗仅增加了 2mA。


四、工程实现的关键细节

很多团队在复制上述硬件和算法后,发现实际降噪效果远达不到预期。这是因为双麦降噪的最终效果,70% 取决于工程实现的细节

4.1 麦克风一致性校准:精度决定上限

差分波束成形的效果高度依赖于两个麦克风的一致性。如果两个麦克风的灵敏度差 0.5dB,降噪深度就会下降 10dB 以上;如果相位差超过 1 度,降噪效果会急剧恶化。

EN-46 在出厂前,每一个单元都会在标准消声室中进行逐台校准

  1. 使用标准声源发出 1kHz 的正弦波信号
  2. 精确测量两个麦克风的输出幅度和相位
  3. 在数字域计算校准系数,将两个麦克风的响应完全对齐

校准精度达到了0.1dB 的幅度误差和 0.1 度的相位误差,这是目前行业内的最高水平。正是因为有了如此高精度的校准,才能实现 50dB 的峰值降噪深度。

4.2 声学腔体设计:PCB 也是声学器件

很多工程师容易忽略的一个事实是:PCB 板本身就是一个重要的声学器件。如果腔体设计不合理,会产生结构共振和声泄漏,严重影响降噪效果。

EN-46 的 PCB 板采用了 1.6mm 厚的 FR-4 材质,麦克风周围做了密封处理,内部填充了吸音材料,有效抑制了结构共振。麦克风与 PCB 板之间采用硅胶垫隔离,减少了振动传导。

对比测试表明,同样的芯片和算法,使用普通 PCB 板安装时,降噪深度只有 28dB;而使用经过优化的声学腔体设计后,降噪深度可以达到 48dB。

4.3 动态范围优化:兼顾小声和大声

一个优秀的降噪系统,必须能够同时处理 20dB 的小声说话和 116dB 的大声喊叫。EN-46 采用了三级自动增益控制 (AGC) 架构

  1. 前置可编程增益放大器 (PGA):0-40dB 可调,适应不同灵敏度的麦克风
  2. 数字 AGC:-20dB 到 + 20dB 可调,自动调节语音音量
  3. 峰值限制器:防止大声说话时出现削波失真

同时,模块采用了 16 位高精度 ADC,动态范围达到了 96dB,确保在各种音量下都能获得清晰的信号。


五、实测性能对比

为了客观评估 EN-46 的性能,我们在标准消声室中进行了对比测试。测试环境为 60dB 白噪音,人声位于正前方 0°,噪音源位于 90° 方向。

表格

技术方案 核心主频 降噪深度 工作电流 算法延迟 接口类型
EN-46 64MHz 36dB (常规)/50dB (近距离) 15mA <10ms 模拟
TI TMS320VC5509A 300MHz 32dB 45mA 15ms 数字
XMOS XU208 400MHz 35dB 120mA 20ms 数字
某国产通用 DSP 200MHz 28dB 38mA 12ms 数字
纯 AI 方案 500MHz 42dB 180mA 30ms 数字

从测试数据可以看出,EN-46 在降噪深度和功耗两个维度上都取得了显著的领先优势,同时保持了极低的算法延迟,完全满足实时通话的要求。


六、嵌入式集成指南

EN-46 的集成非常简单,不需要任何声学知识,5 分钟就能完成。以下是基于 Arduino 平台的最简集成示例:

6.1 接线图

表格

EN-46 引脚 Arduino 引脚 功能
VCC 5V 电源输入
GND GND
OUT A0 模拟音频输出
MODE D2 模式选择(高电平 = 近距离模式)

6.2 测试代码

cpp

运行

复制代码
// EN-46降噪模块测试代码
const int outPin = A0;
const int modePin = 2;

void setup() {
  Serial.begin(115200);
  pinMode(modePin, OUTPUT);
  digitalWrite(modePin, LOW); // 默认常规模式
  Serial.println("EN-46降噪模块测试开始");
}

void loop() {
  // 读取音频信号
  int audioValue = analogRead(outPin);
  
  // 输出到串口(可通过串口绘图器查看波形)
  Serial.println(audioValue);
  
  // 切换模式(每10秒切换一次)
  static unsigned long lastSwitch = 0;
  if (millis() - lastSwitch > 10000) {
    digitalWrite(modePin, !digitalRead(modePin));
    Serial.print("模式切换为:");
    Serial.println(digitalRead(modePin) ? "近距离模式" : "常规模式");
    lastSwitch = millis();
  }
  
  delay(1);
}

上传代码后,打开 Arduino 的串口绘图器,就可以看到降噪前后的音频波形对比。


七、总结与展望

EN-46 的技术突破,为低功耗音频降噪领域带来了新的思路。它证明了通过硬件架构的专用化、算法的物理化和工程实现的精细化,可以在极低的功耗下实现高性能的降噪效果

对于嵌入式工程师来说,这一技术突破也带来了重要的启示:真正的技术创新不是堆砌参数和功能,而是深入理解问题的本质,用最简单、最有效的方法解决问题。在追求高性能的同时,更要关注功耗、成本和可靠性等工程实际问题。

未来,低功耗音频降噪技术将朝着三个方向发展:

  1. 硬件与算法的深度协同:进一步将更多的算法功能硬件化,实现 "算法即硬件"
  2. 边缘 AI 的轻量化:开发更小、更高效的 AI 模型,实现 "感知 - 决策 - 处理" 的全链路智能化
  3. 多传感器融合:结合麦克风阵列、振动传感器和光学传感器,实现更精准的声源定位和噪音抑制

【技术讨论】 大家在低功耗音频设计中遇到过哪些难题?有没有其他值得关注的低功耗降噪技术?欢迎在评论区分享你的经验和见解。

相关推荐
Mangguo52081 小时前
GPU利用率提升软件横向对比评测:NVIDIA Run:ai、VMware Bitfusion、博云ACE与阿里云PAI灵骏
人工智能·阿里云·云计算
摄影图1 小时前
蓝色光效科技背景图片素材 多场景设计
人工智能·科技·aigc·贴图·插画
AI视觉网奇1 小时前
3d 打印拆分零件
人工智能·深度学习
月诸清酒1 小时前
62-260515 AI 科技日报 (Qwen3.6 模型推理速度再提升,MTP加速至1.8倍)
人工智能
云和数据.ChenGuang1 小时前
FastText的核心优势
人工智能·深度学习·机器学习·数据挖掘·边缘计算
大强同学1 小时前
Gemini cli 登录异常解决办法
人工智能
做萤石二次开发的哈哈1 小时前
怎样通过接口模糊检索语音文件名称?
人工智能·语音识别
b***25111 小时前
动力电池自动生产线的工艺逻辑与运维要点
大数据·人工智能
拓朗工控1 小时前
视觉检测连接工控机:打通智能制造“感知-决策”闭环的核心枢纽
人工智能·视觉检测·制造