使用卷积神经网络进行人类活动识别的特征学习:惯性测量单元和音频数据的案例研究

这篇论文的标题是《Feature learning for Human Activity Recognition using Convolutional Neural Networks: A case study for Inertial Measurement Unit and audio data》,由 Federico Cruciani 等人撰写,发表在《CCF Transactions on Pervasive Computing and Interaction》2020年第2卷的18-32页上。论文主要探讨了使用卷积神经网络(CNN)作为人类活动识别(HAR)的特征学习方法,并以惯性测量单元(IMU)和音频数据为案例进行了研究。

摘要:

  • 论文指出,与传统的机器学习方法相比,CNN能够自动提取特征,越来越常用于HAR。
  • 研究通过一个案例研究,评估了在现实条件下使用预训练CNN特征提取器的效果。
  • 案例研究分为两个主要步骤:首先,评估不同的拓扑结构和参数,以确定最佳的HAR候选模型;其次,将预训练模型作为特征提取器,并评估其在大规模现实世界数据集上的应用。
  • 对于IMU数据,UCI-HAR数据集上的平衡准确率为91.98%,而在现实世界的Extrasensory数据集上为67.51%。对于音频数据,DCASE 2017数据集上的平衡准确率为92.30%,而在Extrasensory数据集上为35.24%。

关键词:

  • 卷积神经网络
  • 深度学习
  • 人类活动识别
  • 自由生活

主要内容:

1. 引言

  • 论文介绍了深度学习方法在计算机视觉和自然语言处理等领域的应用,并指出其在HAR领域的应用相对较新。

2. 相关工作

  • 论文回顾了传统的监督式机器学习方法,并讨论了CNN在特征提取方面的能力。同时,论文还讨论了IMU和基于音频的方法在HAR中的应用。

3. 案例研究

  • 论文提出了一个两步的案例研究:第一步,训练CNN特征提取器并评估不同拓扑和超参数组合的效果;第二步,使用训练好的CNN模型作为特征提取器,将原始数据转换为适合第二分类模型的输入向量。

4. 实验

  • 实验分为两步:第一步是比较不同CNN架构和超参数的性能;第二步是使用第一步中预训练的CNN特征提取器训练第二个模型,并在现实条件下评估第二个模型的性能。

5. 结果

  • 论文报告了IMU和音频案例的结果。对于IMU案例,使用UCI-HAR数据集进行了训练,并在Extrasensory数据集上进行了现实条件下的评估。对于音频案例,使用DCASE 2017数据集进行了训练,并在Extrasensory数据集上进行了评估。

6. 讨论

  • 论文讨论了CNN在特征学习能力方面的主要影响因素,并指出在现实世界数据上进行测试时面临的挑战。

7. 结论

  • 论文得出结论,CNN可以作为HAR的特征学习方法,并提供了一个使用预训练CNN特征提取器的示例。同时,论文指出了未来工作的方向,包括进一步研究CNN作为特征学习方法,以及开发可重用的IMU和基于音频的HAR模型。

参考文献

  • 论文列出了一系列与HAR、CNN、IMU和音频处理相关的参考文献。

附录

  • 论文提供了作者信息和他们所在的研究机构。

整体而言,这篇论文详细地探讨了CNN在HAR领域的应用,并以IMU和音频数据为案例,展示了CNN在特征提取方面的优势和挑战。论文还提出了一个两步的案例研究方法,为未来在现实世界条件下评估CNN提供了一个框架。

相关推荐
cosX+sinY3 分钟前
10 卷积神经网络
python·深度学习·cnn
音视频牛哥6 分钟前
Android RTMP推送|轻量级RTSP服务同屏实践:屏幕+音频+录像全链路落地方案
音视频·大牛直播sdk·android同屏方案·安卓无纸化会议·安卓无纸化同屏·无纸化同屏rtmp·无纸化会议rtsp
今天会营业16 分钟前
学习Markdown
学习
Yueeyuee_31 分钟前
【C#学习Day15笔记】拆箱装箱、 Equals与== 、文件读取IO
笔记·学习·c#
艾莉丝努力练剑1 小时前
【C/C++】类和对象(上):(一)类和结构体,命名规范——两大规范,新的作用域——类域
java·c语言·开发语言·c++·学习·算法
Emotion亦楠2 小时前
Java 学习笔记:常用类、String 与日期时间处理
java·笔记·学习
那就摆吧2 小时前
U-Net vs. 传统CNN:为什么医学图像分割需要跳过连接?
人工智能·神经网络·cnn·u-net·医学图像
深度学习实战训练营2 小时前
中英混合的语音识别XPhoneBERT 监督的音频到音素的编码器结合 f0 特征LID
人工智能·音视频·语音识别
WADesk---瓜子2 小时前
用 AI 自动生成口型同步视频,短视频内容也能一人完成
人工智能·音视频·语音识别·流量运营·用户运营
非凡ghost3 小时前
Wondershare Repairit:专业的视频修复工具
音视频·生活·软件需求