使用卷积神经网络进行人类活动识别的特征学习:惯性测量单元和音频数据的案例研究

这篇论文的标题是《Feature learning for Human Activity Recognition using Convolutional Neural Networks: A case study for Inertial Measurement Unit and audio data》,由 Federico Cruciani 等人撰写,发表在《CCF Transactions on Pervasive Computing and Interaction》2020年第2卷的18-32页上。论文主要探讨了使用卷积神经网络(CNN)作为人类活动识别(HAR)的特征学习方法,并以惯性测量单元(IMU)和音频数据为案例进行了研究。

摘要:

  • 论文指出,与传统的机器学习方法相比,CNN能够自动提取特征,越来越常用于HAR。
  • 研究通过一个案例研究,评估了在现实条件下使用预训练CNN特征提取器的效果。
  • 案例研究分为两个主要步骤:首先,评估不同的拓扑结构和参数,以确定最佳的HAR候选模型;其次,将预训练模型作为特征提取器,并评估其在大规模现实世界数据集上的应用。
  • 对于IMU数据,UCI-HAR数据集上的平衡准确率为91.98%,而在现实世界的Extrasensory数据集上为67.51%。对于音频数据,DCASE 2017数据集上的平衡准确率为92.30%,而在Extrasensory数据集上为35.24%。

关键词:

  • 卷积神经网络
  • 深度学习
  • 人类活动识别
  • 自由生活

主要内容:

1. 引言

  • 论文介绍了深度学习方法在计算机视觉和自然语言处理等领域的应用,并指出其在HAR领域的应用相对较新。

2. 相关工作

  • 论文回顾了传统的监督式机器学习方法,并讨论了CNN在特征提取方面的能力。同时,论文还讨论了IMU和基于音频的方法在HAR中的应用。

3. 案例研究

  • 论文提出了一个两步的案例研究:第一步,训练CNN特征提取器并评估不同拓扑和超参数组合的效果;第二步,使用训练好的CNN模型作为特征提取器,将原始数据转换为适合第二分类模型的输入向量。

4. 实验

  • 实验分为两步:第一步是比较不同CNN架构和超参数的性能;第二步是使用第一步中预训练的CNN特征提取器训练第二个模型,并在现实条件下评估第二个模型的性能。

5. 结果

  • 论文报告了IMU和音频案例的结果。对于IMU案例,使用UCI-HAR数据集进行了训练,并在Extrasensory数据集上进行了现实条件下的评估。对于音频案例,使用DCASE 2017数据集进行了训练,并在Extrasensory数据集上进行了评估。

6. 讨论

  • 论文讨论了CNN在特征学习能力方面的主要影响因素,并指出在现实世界数据上进行测试时面临的挑战。

7. 结论

  • 论文得出结论,CNN可以作为HAR的特征学习方法,并提供了一个使用预训练CNN特征提取器的示例。同时,论文指出了未来工作的方向,包括进一步研究CNN作为特征学习方法,以及开发可重用的IMU和基于音频的HAR模型。

参考文献

  • 论文列出了一系列与HAR、CNN、IMU和音频处理相关的参考文献。

附录

  • 论文提供了作者信息和他们所在的研究机构。

整体而言,这篇论文详细地探讨了CNN在HAR领域的应用,并以IMU和音频数据为案例,展示了CNN在特征提取方面的优势和挑战。论文还提出了一个两步的案例研究方法,为未来在现实世界条件下评估CNN提供了一个框架。

相关推荐
kaixin_啊啊2 天前
突破限制:Melody远程音频管理新体验
音视频
2303_Alpha2 天前
SpringBoot
笔记·学习
萘柰奈2 天前
Unity学习----【进阶】TextMeshPro学习(三)--进阶知识点(TMP基础设置,材质球相关,两个辅助工具类)
学习·unity
沐矢羽2 天前
Tomcat PUT方法任意写文件漏洞学习
学习·tomcat
好奇龙猫2 天前
日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(10):91-100语法+考え方13
学习
Billy_Zuo2 天前
人工智能深度学习——卷积神经网络(CNN)
人工智能·深度学习·cnn
ai产品老杨2 天前
解锁仓储智能调度、运输路径优化、数据实时追踪,全功能降本提效的智慧物流开源了
javascript·人工智能·开源·音视频·能源
MThinker2 天前
02-Media-8-uvc_with_csc.py 使用硬件解码的USB摄像头(UVC)捕获视频并显示的程序
音视频·智能硬件·micropython·canmv·k230
IT古董2 天前
【第五章:计算机视觉-项目实战之图像分类实战】1.经典卷积神经网络模型Backbone与图像-(4)经典卷积神经网络ResNet的架构讲解
人工智能·计算机视觉·cnn
向阳花开_miemie2 天前
Android音频学习(十八)——混音流程
学习·音视频