车载多通道语音识别挑战赛(ICMC-ASR)丨ICASSP2024

希尔贝壳理想汽车西工大音频语音与语言处理研究组新加坡南洋理工大学天津大学WeNet开源社区微软中国信通院 等单位发起的"车载多通道语音识别挑战赛 "(ICMC-ASR) 将作为IEEE 声学、语音与信号处理国际会议**(ICASSP2024)**的旗舰赛事,正式启动。报名参加此次赛事,您将获得:

  • 业界首个新能源车智能座舱多通道实录语音数据集;

  • 超百人的车内驾驶员和乘客间语音对话数据,覆盖不同驾驶场景;

  • 测试车载语音识别的真实技术水平;

  • 顶会 ICASSP2024受邀论文和报告机会;

  • 与国际语音学术和产业界深度交流技术前沿的机会。

官网:https://icmcasr.org

背景

随着汽车成为人们日常生活中不可或缺的一部分,而驾驶舱中传统的触摸交互方式容易分散驾驶员的注意力,存在安全风险,因此,车内基于语音的交互方式得到重视。与通常家庭或会议场景中的语音识别系统不同,驾驶场景中的系统面临更加独特的挑战,缺乏大规模的公共真实车内数据一直是该领域发展的主要障碍。因此,特推出车载多通道语音识别挑战赛(ICMC-ASR)

本次赛事发布一个真实的车内多通道语音语料库,包含约1000 **+**小时、车内真实录制的多通道普通话语音数据,收音设备包含车内分布式麦克风收集的远场数据,以及参与者的头戴麦克风收集的近场数据。更多赛事数据的详细信息请参考官方网站的数据介绍。

数据集样例:

demo1

demo2

赛 道

ICMC-ASR 设立了两个不同的赛道:

• Track I Automatic Speech Recognition (ASR):

提供评估集的真实的说话人日志结果。任务目标是开发基于多通道多说话人语音识别系统。参与者需要关注不同通道数据信息融合、背景噪声抑制以及多说话人重叠等。

• Track II Automatic Speech Diarization and Recognition (ASDR):

去除说话人日志的先验知识(如说话人的分割、说话人标签以及说话人人数),参与者需要使用说话人日志和识别技术对评估集中的每个会话进行分割和转录。该任务接受端到端系统以及允许更多的系统灵活性。

有任何问题,可联系:icmcasr_challenge@aishelldata.com

重要日期

|-------|------------|
| 9.12 | 注册开放 |
| 9.30 | 训练集发布,注册截止 |
| 10.7 | 验证集和基线系统发布 |
| 12.5 | 测试集发布,榜单开启 |
| 12.19 | 最终结果提交截止 |
| 12.30 | 系统说明提交截止 |

注册

ICMC-ASR 赛事对高校、公司和科研机构开放,并邀请排名靠前的队伍基于竞赛系统形成论文,在 ICASSP2024 上发表。参赛者在9月30日前可登录赛事官网 (https://icmcasr.org) 进行注册,请按照以下要求注册挑战赛:

  1. 机构或者公司邮箱注册,个人邮箱如 163.com、qq.com等不可;

  2. 提供团队名称、隶属机构、参与赛道信息。

主办方将在3个工作日内通过电子邮件通知符合条件的参赛团队,团队必须遵守赛事官网上发布的挑战规则。本次赛事最终解释权归组委会。

组织者

  • Lei Xie, Northwestern Polytechnical University

  • Eng Siong Chng, Nanyang Technological University

  • Zhuo Chen, Microsoft Corporation

  • Jian Wu, Microsoft Corporation

  • Longbiao Wang, Tianjin University

  • Hui Bu, AIShell Inc and AIShell Foundation

  • Xin Xu, AIShell Inc

  • Binbin Zhang, WeNet Open Source Community

  • Wei Chen, Li Auto

  • Pan Zhou, Li Auto

  • He Wang, Northwestern Polytechnical University

  • Pengcheng Guo, Northwestern Polytechnical University

  • Sun Li, China Academy of Information and Communication Technology

相关推荐
Elastic 中国社区官方博客19 小时前
Elasticsearch:使用 Agent Builder 的 A2A 实现 - 开发者的圣诞颂歌
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
chools19 小时前
【AI超级智能体】快速搞懂工具调用Tool Calling 和 MCP协议
java·人工智能·学习·ai
郝学胜-神的一滴19 小时前
深度学习必学:PyTorch 神经网络参数初始化全攻略(原理 + 代码 + 选择指南)
人工智能·pytorch·python·深度学习·神经网络·机器学习
leobertlan19 小时前
好玩系列:用20元实现快乐保存器
android·人工智能·算法
笨笨饿19 小时前
#58_万能函数的构造方法:ReLU函数
数据结构·人工智能·stm32·单片机·硬件工程·学习方法
jr-create(•̀⌄•́)19 小时前
从零开始:手动实现神经网络识别手写数字(完整代码讲解)
人工智能·深度学习·神经网络
冬奇Lab20 小时前
一天一个开源项目(第78篇):MiroFish - 用群体智能引擎预测未来
人工智能·开源·资讯
冬奇Lab20 小时前
你的 Skill 真的好用吗?来自OpenAI的 Eval 系统化验证 Agent 技能方法论
人工智能·openai
数智工坊20 小时前
Transformer 全套逻辑:公式推导 + 原理解剖 + 逐行精读 - 划时代封神之作!
人工智能·深度学习·transformer
GreenTea20 小时前
AI 时代,工程师的不可替代性在哪里
前端·人工智能·后端