文章目录
-
- 引言
- 正文
-
- [Call for participation参赛要求](#Call for participation参赛要求)
- Dataset数据集
-
- Prompt数据采样时的提示词
- [The Corpus语料库](#The Corpus语料库)
- Instructions指导
-
- [Important Note重要提示](#Important Note重要提示)
- Tasks任务说明
- Evaluation
-
- [Classification task分类任务](#Classification task分类任务)
- Regression回归任务
- Schedule时间安排
- 实际数据集说明
- 总结
引言
- ICASSP和InterSpeech两个顶会基本上都是轮流举办有关痴呆的检测比赛,前五可以发一个论文,只要两页,还不是短文,可以参加一下!
正文
Call for participation参赛要求
- "通过自发语音的认知能力下降预测与识别(PROCESS)信号处理大奖赛"提出了通过语音检测痴呆症的信号处理和预测任务。
数据构成和主要形式
- 此次挑战的目标不仅是检测已发展为疾病的认知能力下降,例如阿尔茨海默病 ,还包括识别早期阶段,如轻度认知障碍(MCI),这对于及时的临床干预至关重要。
- PROCESS挑战赛继承了**ADReSS [1]、ADReSSo [2]和ADReSS-M [3]**的传统,但与这些前期挑战不同,PROCESS基于的数据尚未公开发布 。
- 此外,在这个语料库中,主要是三部分
- 基于"Cookie Theft""的图片描述任务
- "一分钟内说出尽可能多的动物名称"的流利度测试
- 还有一个未知,暂时没有公布
- 此外,在这个语料库中,主要是三部分
赛制流程
-
我们邀请参与者在本次挑战赛中参与两项任务:
- 分类任务,旨在预测说话者的诊断结果(健康、轻度认知障碍、痴呆)
- 回归任务,旨在预测反映认知能力下降的测试分数。
-
排名前五的团队将被邀请撰写两页论文,详细介绍他们的方法,并在ICASSP 2025会议上展示他们的成果。被接受的论文将被收录在ICASSP会议论文集中。
-
此外,展示其工作的团队将被邀请向IEEE开放信号处理期刊(OJ-SP)提交扩展论文。
-
我们鼓励所有参与者,不论最终排名如何,将他们的论文发布在arXiv或medRxiv等预印本平台上,并通过公共存储库分享他们的代码。
比赛目的
- 本次挑战赛旨在搭建一个平台,促进关于使用语音信号处理和人工智能(AI)模型进行早期痴呆检测的贡献与讨论。
- 我们邀请提交展示创新AI模型、创新语音信号处理技术以及创新特征选择和提取方法的论文,这对于推进早期痴呆检测和开发临床痴呆诊断应用至关重要。
Dataset数据集
- 在本次挑战赛中,我们向社区提供了最新的语料库,专注于早期痴呆检测 。该语料库对于推动痴呆检测研究具有高度的相关性,并延续了由Luz及其团队主导的前期挑战赛的影响力。PROCESS数据具有以下优势:
- 涵盖的诊断类别多
- 该语料库涵盖了更多早期痴呆不同亚型的诊断类别,包括轻度认知障碍(MCI),与实际临床诊断一致,能够检测早期痴呆,使研究问题更贴近现实应用。
- 对照组贴合实际情况
- 健康对照组(HCs)由没有已知认知障碍的志愿者 组成,还包括那些可能存在非神经退行性疾病引起的记忆问题的群体。这与临床实际情况相符,能够帮助早期识别有痴呆风险的人群与需要治疗其他原因引起的记忆问题的人群,具有重要意义。
- 诊断指标全面
- 该语料库除了提供认知评估分数外,还附带了诊断类别标签 。由于数据的多样性,提供了包括蒙特利尔认知评估(MoCA) 、简易认知检查(MCE)和 阿尔茨海默认知评估-III(ACE-III)等多种不同的评分,反映了临床在痴呆和中风等路径上的标准实践差异。部分受试者还会提供从MoCA、MCE或ACE-III分数转换的统一简易精神状态检查(MMSE)分数,该转换分数将作为预测任务的基础,而诊断类别标签将支持分类任务。
- 涵盖的诊断类别多
Prompt数据采样时的提示词
-
该语料库的采集方法基于痴呆诊断的神经科学研究,包含三种引导任务的音频数据:语义流利度任务、语音流利度任务和"偷饼干"图片描述任务。
-
语义流利度任务
- 语义流利度任务要求参与者在一分钟内回答"请尽可能多地说出动物的名字" 。这类似于许多认知评估中的命名任务,主要用于评估语言能力和命名技巧,以检测语言理解和表达方面的潜在问题。
-
语音流利度任务
- 语音流利度任务要求参与者在一分钟内回答"请尽可能多地说出以字母'P'开头的词语 ,除去人名(如Peter)或国家名(如Portugal)。" 这一任务与认知评估中的语言任务类似,旨在测试语言相关的语词流利度和执行功能。
-
Cookie Theft任务
- "Cookie Theft "图片描述任务。图1展示了"Cokie Theft "图片,要求受试者对其进行描述 。这种方法在痴呆检测研究中广泛用于采集音频数据。此类音频预计能够反映受试者的多种认知功能,例如语言理解和记忆能力。
The Corpus语料库
- 训练集和开发集包括每位受试者的音频录音及其对应的手动转录文本 。
- 分类任务 中为每位受试者提供诊断信息(如健康、轻度认知障碍、痴呆)
- 回归任务 中提供每位受试者的MMSE分数。
重要提示
- 测试集不提供转录文本和诊断信息,因为提供手动转录与现代自动检测系统的设计原则相冲突。
Instructions指导
Important Note重要提示
-
知识产权(IP)不会转移给挑战赛组织者
-
提交模型数量
- 参赛者最多可以提交来自三个不同模型的三个结果,最终以最好的作为评判标准
-
任务提交说明
- 无论是分类任务还是回归任务,参与者必须使用我们与测试集一起发布的template.csv文件来生成预测结果,该文件包含测试ID
- 我们建议参与者按以下格式提交预测结果:PROCESS_classification_model1.csv,PROCESS_regression_model1.csv。
Tasks任务说明
分类任务
- 此任务旨在通过处理受试者的语音 ,识别那些患有不同认知障碍和痴呆症的人与健康志愿者。
回归任务
- 此任务是通过受试者的语音预测其相应的简易精神状态检查(MMSE)分数。
Evaluation
Classification task分类任务
- 分类任务的评估将通过标准的分类和回归指标进行。可以通过统计
- 全局的真正例(True Positives)、假负例(False Negatives)和假正例(False Positives)来计算这些指标。
Regression回归任务
Schedule时间安排
-
7月29日:PROCESS信号处理大奖赛宣布并发布参赛邀请。
-
8月30日:训练集和开发集发布。欲参赛,请填写注册表。
-
10月31日:注册截止日期。
-
11月29日:测试集和基线结果发布。
-
12月6日:结果提交截止日期。
-
12月9日:受邀提交两页论文的通知。
-
12月30日:论文提交截止日期。
-
4月6日至11日:ICASSP 2025会议。
实际数据集说明
- "dem-info.csv"文件包含所有受试者的标签和元数据。该 CSV 文件的列包括:
- "Record-ID":受试者的标识符,对应文件夹名称
- "TrainOrDev":受试者属于训练集(train)还是开发集(dev)
- "Class":受试者的分类,包括三类:痴呆(Dementia)、轻度认知障碍(MCI)或健康对照(HC)
- "Gender":受试者的性别,男或女
- "Age":受试者参与研究时的年龄,对于没有已知年龄的参与者,提供了整个语料库的平均年龄,并用星号标记(66*)
- "Converted-MMSE":受试者的简短精神状态检查(MMSE)分数,如有;如果 MMSE 不可用,则从 Moca 和 ACE-III 量表转换得到。
- 单个样本的文件内容说明,每个文件夹包含三个任务的音频和手动转录文件 :
- CTD(偷饼干图片描述任务)
- PFT(语音流畅性测试-音位)
- SFT(语音流畅性测试-语义)
- 在每个文件夹中,CTD 任务的音频和转录文件分别为 Process-rec-XXX__CTD.wav 和 Process-rec-XXX__CTD.txt。
总结
- 这个比赛报名参加了,但是不是很确定他具体数据格式,是每一个样本和都提供三种不同类型的数据,还是每一个样本都随机提供一个类型的数据?
- 立一个flag,留一个悬念,看看能不能拿个前五,在整个论文!