全功能DSP语音模组AU‑60,机器人远场拾音利器

AU‑60 是集成AI 降噪 (ENC)、全双工回音消除 (AEC)、波束成形 (BF)、USB/I2S / 模拟音频 于一体的全功能 DSP 语音处理模组,可快速赋予机器人远场拾音、强降噪、全双工通话、定向拾音、免驱语音交互能力,适配服务、巡检、教育、陪伴、工业等各类机器人场景,大幅简化音频硬件与算法开发,提升语音交互稳定性与体验。


二、AU‑60 为机器人提供的核心能力

1. 音频前端处理(硬件级实时,不占主控算力)

  • AI 智能降噪 (ENC) :压制风扇、电机、碰撞、风噪等非人声干扰,仅保留清晰人声,降噪深度45--90 dB
  • 全双工回音消除 (AEC) :消除高达100 dB喇叭回音,支持机器人边播边听,无啸叫、无断话,延迟 **≤100 ms**。
  • 双麦波束成形 (BF) :单 / 双波束定向拾音,抑制侧向 / 后方噪音,提升3--5 米远场识别率,支持双独立声道输出。
  • 自适应拾音距离 :通过 T1/T2 端口切换近 / 中 / 远 / 超远4 档拾音(0.1--8 m),适配不同交互距离。

2. 丰富接口与系统兼容

  • USB 免驱:Windows/Android/Linux 直连,即插即用,无需额外 ADC/DAC。
  • I2S 数字音频:16 kHz/16 bit 主模式输出,抗干扰强,音质纯净。
  • 模拟音频:MIC IN/Line Out/AEC 参考输入,兼容传统音频主板。
  • SPI 控制:外部 MCU 动态调节降噪、增益、AEC 强度等参数。

3. 机器人专属功能价值

  • 运动降噪:消除底盘电机、风扇、舵机噪音,移动中仍清晰拾音。
  • 全双工对话:播报同时可打断、可插话,自然流畅。
  • 远场免触:3--5 米正常说话即可唤醒 / 指令,无需靠近按键。
  • 定向交互:波束锁定说话人,多人 / 嘈杂环境不误触发。
  • 简化设计 :SMT 邮票孔,体积37.5×16 mm,替代复杂音频电路。

三、硬件设计(机器人集成标准方案)

1. 典型连接拓扑

主控 (STM32/RK3588/IMX6/Android 主板) ↔ AU‑60 ↔ 麦克风 (模拟 / PDM 数字) ↔ 功放 + 喇叭

2. 推荐模式:USB 免驱 + 双数字麦波束(最优性价比)

  • 电源:5V/≥300 mA(模组 65--80 mA + 麦 + 功放)。
  • 麦克风:双 PDM 数字麦,间距6 cm,CLK/DAT 接 AU‑60 对应引脚。
  • AEC 参考:从功放前端取信号接入AECIN (26 脚) ,小信号可直连,大功率串1 μF+10 kΩ分压隔离。
  • 参数切换:T1/T1 (9/11 脚) 对地 0Ω 电阻切换拾音距离 / 降噪等级。
  • SPI 扩展:用于动态调参(可选)。

3. 引脚关键配置

表格

引脚 功能 机器人用法
1 MICOUT 降噪后模拟输出
5/6/8 LRCK/BCLK/D_OUT I2S 数字音频输出
14/15 DAT/CLK 数字麦 PDM 输入
26 AECIN 回音消除参考输入
9/11 T2/T1 拾音距离 / 降噪档位切换
21--24 SPI 接口 MCU 动态参数配置
13 +5V 主电源输入

四、软件架构与交互流程

1. 软件分层

  1. 驱动层:USB 免驱 / UAC 标准音频;I2S 按 16 kHz/16 bit 配置;GPIO 控制 T1/T2 切换模式。
  2. 算法层 :AU‑60 硬件完成AEC/ENC/BF/VAD,主控仅做后处理。
  3. 应用层:唤醒词→语音识别→NLP→TTS 播报→全双工交互→指令执行。

2. 标准交互流程

  1. 上电:AU‑60 2 秒就绪,MCU 延时 1 秒后可 SPI 配置。
  2. 拾音:双麦→BF 定向→ENC 降噪→AEC 消回音。
  3. 输出:USB/I2S / 模拟送主控。
  4. 识别:本地 / 云端 ASR 转文字。
  5. 执行:导航、问答、控制、播报等。
  6. 全双工:播报时持续拾音,支持打断。

3. 模式切换软件逻辑(T1/T2 控制)

  • T1 = 高,T2 = 高:中距离(0.5--2 m,通用)
  • T1 = 高,T2 = 低:近距离(0.1--0.2 m,贴身)
  • T1 = 低,T2 = 高:远距离(0.5--5 m,大厅)
  • T1 = 低,T2 = 低:超远距离(0.5--8 m,空旷)

五、性能指标(机器人场景)

  • 工作电压:3.0--3.3 V 或 4.0--5.25 V
  • 工作电流:65--80 mA
  • 信噪比:105 dB
  • 回音消除:100 dB,延迟 **≤100 ms**
  • 拾音范围:0.1--8 m(档位可调)
  • 工作温度:-20℃~70℃(工业可定制 -40℃~85℃)
  • 接口:USB/I2S / 模拟 / SPI
  • 尺寸:37.5×16 mm,SMT 邮票孔

六、典型场景与配置建议

表格

机器人类型 推荐配置 核心效果
服务 / 导览 USB + 双麦波束 3--5 米远场,抗环境噪音
教育 / 陪伴 USB + 模拟麦 低成本,免驱,稳定
工业 / 巡检 I2S + 双麦 + SPI 抗干扰,远程调参,高可靠
移动 / 底盘 全双工 AEC 移动播报可打断,无回音

七、开发与调试要点

  1. AEC 参考 :优先从功放前端取小信号;后端取信号必须阻容分压
  2. 供电:5V 纹波 **≤50 mV**,避免底噪。
  3. 麦布局 :双麦间距6 cm,远离喇叭与风扇。
  4. 固件:双麦波束、双输出、USB 立体声等需对应固件。
  5. SPI 控制:上电延时 1 秒后再发配置指令。

八、方案优势总结

  1. 一站式语音前端 :硬件集成 AEC/ENC/BF,零算法开发
  2. 接口全兼容:USB 免驱快速落地,I2S / 模拟适配高端机型。
  3. 强鲁棒性:运动噪音、风噪、大音量回音均能抑制。
  4. 小体积易集成:SMT 贴片,简化 BOM,降低成本。
  5. 参数可定制:拾音距离、降噪强度、波束角度灵活配置。
相关推荐
沫儿笙6 小时前
川崎焊接机器人保护气节气装置
机器人
Deepoch7 小时前
Deepoc VLA开发板:采摘机器人自主决策与柔性协同系统
机器人·开发板·deepoc·采摘
Flying Youth8 小时前
【Embodiment Gap in Robot Learning: A Comprehensive Survey】
机器人
小陶来咯8 小时前
机器人触摸反馈模块:3x3 随机匹配 + 概率语音播报
机器人
工业机器人销售服务8 小时前
遨博产品尺寸偏差智能检测,微米级筛查误差,严控成品装配精度
机器人·自动化
百度智能云技术站9 小时前
训练周期减半:LoongForge 全链路优化 GR00T N1.6 训练,吞吐提升至 2.3 倍
机器人·llm
才兄说10 小时前
机器人二次开发机器狗巡检?高精度自主定位
机器人
小烤箱13 小时前
什么是 ROS2:机器人软件的数据加工工业园区
人工智能·机器人·ros
梦想的旅途214 小时前
企微API:外部群的主动/被动自动回复机器人
机器人·企业微信·rpa