使用卷积神经网络进行人类活动识别的特征学习：惯性测量单元和音频数据的案例研究

这篇论文的标题是《Feature learning for Human Activity Recognition using Convolutional Neural Networks: A case study for Inertial Measurement Unit and audio data》，由 Federico Cruciani 等人撰写，发表在《CCF Transactions on Pervasive Computing and Interaction》2020年第2卷的18-32页上。论文主要探讨了使用卷积神经网络（CNN）作为人类活动识别（HAR）的特征学习方法，并以惯性测量单元（IMU）和音频数据为案例进行了研究。

摘要：

论文指出，与传统的机器学习方法相比，CNN能够自动提取特征，越来越常用于HAR。
研究通过一个案例研究，评估了在现实条件下使用预训练CNN特征提取器的效果。
案例研究分为两个主要步骤：首先，评估不同的拓扑结构和参数，以确定最佳的HAR候选模型；其次，将预训练模型作为特征提取器，并评估其在大规模现实世界数据集上的应用。
对于IMU数据，UCI-HAR数据集上的平衡准确率为91.98%，而在现实世界的Extrasensory数据集上为67.51%。对于音频数据，DCASE 2017数据集上的平衡准确率为92.30%，而在Extrasensory数据集上为35.24%。

关键词：

卷积神经网络
深度学习
人类活动识别
自由生活

主要内容：

1. 引言

论文介绍了深度学习方法在计算机视觉和自然语言处理等领域的应用，并指出其在HAR领域的应用相对较新。

2. 相关工作

论文回顾了传统的监督式机器学习方法，并讨论了CNN在特征提取方面的能力。同时，论文还讨论了IMU和基于音频的方法在HAR中的应用。

3. 案例研究

论文提出了一个两步的案例研究：第一步，训练CNN特征提取器并评估不同拓扑和超参数组合的效果；第二步，使用训练好的CNN模型作为特征提取器，将原始数据转换为适合第二分类模型的输入向量。

4. 实验

实验分为两步：第一步是比较不同CNN架构和超参数的性能；第二步是使用第一步中预训练的CNN特征提取器训练第二个模型，并在现实条件下评估第二个模型的性能。

5. 结果

论文报告了IMU和音频案例的结果。对于IMU案例，使用UCI-HAR数据集进行了训练，并在Extrasensory数据集上进行了现实条件下的评估。对于音频案例，使用DCASE 2017数据集进行了训练，并在Extrasensory数据集上进行了评估。

6. 讨论

论文讨论了CNN在特征学习能力方面的主要影响因素，并指出在现实世界数据上进行测试时面临的挑战。

7. 结论

论文得出结论，CNN可以作为HAR的特征学习方法，并提供了一个使用预训练CNN特征提取器的示例。同时，论文指出了未来工作的方向，包括进一步研究CNN作为特征学习方法，以及开发可重用的IMU和基于音频的HAR模型。

参考文献

论文列出了一系列与HAR、CNN、IMU和音频处理相关的参考文献。

附录

论文提供了作者信息和他们所在的研究机构。

整体而言，这篇论文详细地探讨了CNN在HAR领域的应用，并以IMU和音频数据为案例，展示了CNN在特征提取方面的优势和挑战。论文还提出了一个两步的案例研究方法，为未来在现实世界条件下评估CNN提供了一个框架。