【工业智能】音频信号相关场景

【工业智能】音频信号相关场景

与计算机视觉CV相对应,计算机听觉computer audition,简称CA。

Dcase

这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)

https://dcase.community/

Dcase introduction:

DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。

dcase2024有10个主题的任务:

Task 1

Data-Efficient Low-Complexity Acoustic Scene Classification

数据高效的,低复杂度的,声学场景分类

Task 2

First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring

首次无监督的异音检测,用于设备状态监测

Task 3

Audio and audiovisual sound event localization and detection with source distance estimation

具有音频源头距离估计的 音频和视听声音事件 定位和检测

Task 4

Sound event detection with heterogeneous training dataset and potentially missing labels

使用异构训练数据集和潜在缺失标签的声音事件检测

Task 5

Few-shot Bioacoustic Event Detection

小样本生物声学事件检测

Task 6

Automated Audio Captioning

自动生成音频字母

Task 7

Sound Scene Synthesis

声景合成

Task 8

Language-Based Audio Retrieval

基于语言的音频检索

Task 9

Language-Queried Audio Source Separation

基于语言查询的音频源分离

Task 10

Acoustic-based traffic monitoring

基于声学的交通监控

和工业智能比较相关的是task2和task4

ASD

异音检测ASD,即 Anomalous Sound Detection 。

人耳听音的缺点:

  • 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
  • 人疲劳的时候,会误判
  • 长期听音对人耳会造成不可逆的伤害

硬件设备

麦克风

听诊器

声级计(异音一般在频谱中很抢眼)

频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。

也会使用振动加速度传感器。

产品商

https://www.ntiaudio.cn/

https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍

https://www.puseng.net/ant-test

https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍

方法

频谱检测

高次谐波失真面积计算

斜率突变计算

常用模型:HMM GMM

常用特征:MFCC MPEG-7

reference:https://blog.csdn.net/yjjat1989/article/details/44961279

制造业应用场景

基于声信号进行结构损伤检测

托辊异常声音检测

电极压缩机异音检测

刀具磨损状态监控

判定轴承与齿轮等是否异常

压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位

zenodo

再分享一下zenodo平台,

Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献

reference:

https://zhuanlan.zhihu.com/p/646962108

音频事件检测

reference:

https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。

相关推荐
Enabler_Rx5 小时前
AI辅助制作宣传视频
音视频
PhoenixAI85 小时前
保姆级教程-剪映多视频融合及识别文字转换方法
音视频
liaomin41610056913 小时前
transformers音频实战02-基于 Speech Commands 数据集的语音识别实战项目全流程
人工智能·音视频·语音识别
_张一凡14 小时前
OpenAI Sora 2提示词指南:打造精准视频生成指令
aigc·音视频
月起星九1 天前
为什么ffmpeg进行视频合成有时长误差
ffmpeg·音视频
湖南人爱科技有限公司1 天前
RaPhp和Python某音最新bd-ticket-guard-client-data加密算法解析(视频评论)
android·python·php·音视频·爬山算法·raphp
却道天凉_好个秋2 天前
OpenCV(四):视频采集与保存
人工智能·opencv·音视频
苏打水com2 天前
字节跳动前端业务:从「短视频交互」到「全球化适配」的技术挑战
前端·音视频
人工智能技术派2 天前
Qwen-Audio:一种新的大规模音频-语言模型
人工智能·语言模型·音视频