赋能医疗保健：TinyML用于精确的肺部疾病分类

论文标题：Empowering Healthcare: TinyML for Precise Lung Disease Classification

中文标题：赋能医疗保健：TinyML用于精确的肺部疾病分类

作者信息：

Youssef Abadade，系统工程实验室，国家应用科学学院，Ibn Tofail University of Kenitra，Kenitra B.P 242, Morocco
Nabil Benamar，技术学院，Moulay Ismail University of Meknes，Meknes 50050, Morocco；科学与工程学院，Al Akhawayn University in Ifrane，P.O. Box 104, Hassan II Avenue, Ifrane 53000, Morocco
Miloud Bagaa，电子与计算机工程系，University of Quebec at Trois-Rivieres，Trois-Rivieres, QC G8Z 4M3, Canada
Habiba Chaoui，系统工程实验室，国家应用科学学院，Ibn Tofail University of Kenitra，Kenitra B.P 242, Morocco

论文出处：发表于《Future Internet》杂志，2024年，16卷，391页，DOI链接：Empowering Healthcare: TinyML for Precise Lung Disease Classification，可通过以下网址访问：Future Internet | An Open Access Journal from MDPI。

主要内容概述：

摘要(Abstract)： 本研究旨在开发一种基于Tiny Machine Learning (TinyML)的模型，用于实时检测呼吸状况，特别是通过肺部声音记录来区分哮喘和非哮喘状况。研究中训练了三种机器学习模型------自定义卷积神经网络（CNN）、Edge Impulse CNN和自定义长短期记忆网络（LSTM）------在一个公开可用的肺部声音数据集上。数据预处理包括带通滤波和通过Mel-Frequency Cepstral Coefficients (MFCCs)的特征提取。应用了量化技术以确保模型效率。自定义CNN模型表现最佳，准确率达到96%，精确度、召回率和F1分数均为97%，同时保持适度的资源使用。这些发现突出了TinyML在提供可访问、可靠和实时诊断工具方面的潜力，特别是在偏远和资源不足的地区，展示了将先进AI算法集成到便携式医疗设备中的变革性影响。

1. 引言(Introduction)： 全球范围内，肺部疾病如哮喘是导致死亡的主要原因之一。传统的听诊器虽然广泛用于诊断呼吸状况，但它存在局限性，比如缺乏录音功能、依赖医生的专业判断以及没有噪声过滤能力。为了克服这些限制，数字听诊器被开发出来以数字化和记录肺部声音。最近，使用深度学习（DL）自动分析肺部声音的兴趣日益增长。然而，大型DL模型在云端执行常常导致延迟，依赖互联网连接，并可能因传输敏感健康数据而引起隐私问题。为了应对这些挑战，研究者开发了TinyML模型，用于在低功耗、成本效益高的设备上实时检测呼吸状况。

2. 相关工作(Related Works)： 许多研究论文已经检查了使用深度学习来识别模式和区分各种肺部状况的原始呼吸声音数据的应用。这些研究使用了不同的数据集、特征提取方法和模型，包括人工神经网络（ANN）、CNN和LSTM，以及它们的混合模型，以实现高准确率的分类，并主要在云端平台上部署解决方案。

3. 材料和方法(Materials and Methods)： 本节描述了用于获取、预处理和构建模型以区分正常和哮喘状况的各种方法。使用Edge Impulse平台进行模型训练、超参数调整和优化，以便在各种边缘设备上运行。研究使用了来自约旦国王阿卜杜拉大学医院的公开数据集，并进行了带通滤波处理以减少外部噪声。特征提取阶段将原始音频信号转换为用于分类的有用表示，特别是通过MFCCs。本研究开发了三种分类器，即自定义CNN模型、Edge Impulse提出的CNN模型和自定义LSTM模型，以诊断两种不同的呼吸状况，即哮喘和正常。

4. 结果和讨论(Results and Discussion)： 本节比较了三种模型的性能，包括准确率、精确度、召回率、F1分数和曲线下面积（AUC），以及模型大小、推理时间和峰值RAM使用情况，这些对于在TinyML设备上部署至关重要。自定义CNN模型在测试集上实现了96%的准确率和0.96的AUC。CNN Edge Impulse模型虽然速度更快、资源消耗更少，但准确率较低，为85%，AUC为0.85。自定义LSTM模型的准确率为90%，低于CNN。

5. 结论和未来工作(Conclusions and Future Work)： 本研究利用TinyML模型检测肺部疾病，特别是哮喘，通过肺部声音记录。自定义CNN模型在保持高效资源使用的同时实现了96%的准确率。这表明在资源受限的设备上部署实时、准确的诊断工具是可行的，使其适合便携式医疗应用。未来工作将解决数据集不平衡的挑战，探索合并多个公开可用的肺部声音数据集，并应用数据增强技术，以及进行实际的临床验证和包含更多呼吸状况的研究。