希尔贝壳与西湖大学音频信息与信号处理实验室联合发布的论文被国际顶级会议 NeurIPS 2024 录用

神经信息处理系统大会(Conference on Neural Information Processing Systems,NeurIPS)是中国计算机学会(CCF)推荐的人工智能领域 A 类学术会议,其 H5 指数高达 337,在 Google Scholar 的 AI 类出版物中排名第一,与 ICML 和 ICLR 并称为机器学习领域难度最高、影响力最大的"三大会议"。

今年的会议 NeurIPS 2024 将于 12 月 10 日至 15 日在加拿大温哥华的 Vancouver Convention Center 举行。大会总共收到了 15671 篇有效投稿,最终录用率为 25.8%。希尔贝壳西湖大学音频信息与信号处理实验室联合发布的论文成功入选。

RealMAN是由希尔贝壳(AISHELL)与西湖大学音频信息与信号处理实验室(AUDIOLAB)联合开源的一个规模较大、实录、带标注的多通道麦克风语音与噪声数据集(RealMAN)。

数据组成

RealMAN是一个面向动态声学场景语音增强与声源定位任务的麦克风阵列音频数据集。具体而言,该数据集使用32通道高精度麦克风阵列进行录音,使用扬声器播放语音源信号。总共包括32个场景下录制的语音信号83小时(其中48小时为静态扬声器,35小时为移动扬声器),31个场景下录制的背景噪声144小时。

数据说明

RealMAN语音和噪声录制场景覆盖了各种常见的室内、室外、半室外和交通环境。录音设备见图1。借助于全向鱼眼摄像机标注扬声器相较于麦克风阵列的水平角,该标注可用于声源定位网络的训练。使用估计得到的直达路径滤波器对播放的语音源信号进行滤波,进而得到直达路径信号,方便语音增强网络的训练。

实验结果

  • 相比模拟数据,使用RealMAN数据集能够训练出更好的语音增强和声源定位网络;

  • 使用32通道麦克风阵列组成的不同子阵列可以训练出直接用于未见阵列的变阵列网络。

相关推荐
三品吉他手会点灯1 天前
C语言学习笔记 - 20.C编程预备计算机专业知识 - 变量为什么必须的初始化【重点】
c语言·笔记·学习
sakiko_1 天前
UIKit学习笔记1-创建项目(使用UIKit)、使用组件
笔记·学习
生信碱移1 天前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
星幻元宇VR1 天前
VR航空航天科普设备【VR时空直升机】
科技·学习·安全·生活·vr
_李小白1 天前
【android opencv学习笔记】Day 2: Mat类(图片数据结构体)
android·opencv·学习
harder3211 天前
RMP模式的创新突破
开发语言·学习·ios·swift·策略模式
程序猿乐锅1 天前
【Tilas|第三篇】多表SQL语句
数据库·经验分享·笔记·学习·mysql
徐某人..1 天前
基于i.MX6ULL平台的智能网关系统开发
arm开发·c++·单片机·qt·物联网·学习·arm
AOwhisky1 天前
Kubernetes 学习笔记:集群管理、命名空间与 Pod 基础
linux·运维·笔记·学习·云原生·kubernetes
光影少年1 天前
大屏页面,一次多个请求,请求加密导致 点击 全局时间选择器 时出现卡顿咋解决(面板收起会延迟1~2秒)
前端·javascript·vue.js·学习·前端框架·echarts·reactjs