希尔贝壳与西湖大学音频信息与信号处理实验室联合发布的论文被国际顶级会议 NeurIPS 2024 录用

神经信息处理系统大会(Conference on Neural Information Processing Systems,NeurIPS)是中国计算机学会(CCF)推荐的人工智能领域 A 类学术会议,其 H5 指数高达 337,在 Google Scholar 的 AI 类出版物中排名第一,与 ICML 和 ICLR 并称为机器学习领域难度最高、影响力最大的"三大会议"。

今年的会议 NeurIPS 2024 将于 12 月 10 日至 15 日在加拿大温哥华的 Vancouver Convention Center 举行。大会总共收到了 15671 篇有效投稿,最终录用率为 25.8%。希尔贝壳西湖大学音频信息与信号处理实验室联合发布的论文成功入选。

RealMAN是由希尔贝壳(AISHELL)与西湖大学音频信息与信号处理实验室(AUDIOLAB)联合开源的一个规模较大、实录、带标注的多通道麦克风语音与噪声数据集(RealMAN)。

数据组成

RealMAN是一个面向动态声学场景语音增强与声源定位任务的麦克风阵列音频数据集。具体而言,该数据集使用32通道高精度麦克风阵列进行录音,使用扬声器播放语音源信号。总共包括32个场景下录制的语音信号83小时(其中48小时为静态扬声器,35小时为移动扬声器),31个场景下录制的背景噪声144小时。

数据说明

RealMAN语音和噪声录制场景覆盖了各种常见的室内、室外、半室外和交通环境。录音设备见图1。借助于全向鱼眼摄像机标注扬声器相较于麦克风阵列的水平角,该标注可用于声源定位网络的训练。使用估计得到的直达路径滤波器对播放的语音源信号进行滤波,进而得到直达路径信号,方便语音增强网络的训练。

实验结果

  • 相比模拟数据,使用RealMAN数据集能够训练出更好的语音增强和声源定位网络;

  • 使用32通道麦克风阵列组成的不同子阵列可以训练出直接用于未见阵列的变阵列网络。

相关推荐
小猪佩奇TONY17 分钟前
Linux 内核学习(13) --- linux 内核并发与竞态
linux·服务器·学习
黑客思维者19 分钟前
机器学习011:监督学习【回归算法】(多项式回归)-- 从“猜咖啡温度”到预测万物
人工智能·学习·机器学习·回归·线性回归·监督学习·多项式回归
deng-c-f20 分钟前
Linux C/C++ 学习日记(56):用户态网络缓存区
学习·缓存
d111111111d23 分钟前
STM32平衡车开发计划2-电机编码器测速
笔记·stm32·单片机·嵌入式硬件·学习
黑客思维者25 分钟前
机器学习010:监督学习【回归算法】(Lasso回归)-- 用“魔法剪刀”找到真正重要的信息
人工智能·学习·机器学习·回归·监督学习·回归算法·lasso
zhangrelay27 分钟前
新旧交替-传统模式被逐步抛弃……(节选)
学习
deng-c-f34 分钟前
Linux C/C++ 学习日记(55):原子操作(四):实现无锁队列
学习
小韩博42 分钟前
小迪安全 · 第 39 课学习笔记
笔记·学习·安全·网络安全
非凡ghost42 分钟前
Topaz Video(人工智能视频增强软件)
人工智能·windows·学习·音视频·软件需求
重生之我在番茄自学网安拯救世界1 小时前
网络安全中级阶段学习笔记(十):upload靶场实战(17关以及问题解决)
笔记·学习·网络安全·文件上传漏洞·图片木马