【工业智能】音频信号相关场景

【工业智能】音频信号相关场景

与计算机视觉CV相对应,计算机听觉computer audition,简称CA。

Dcase

这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)

https://dcase.community/

Dcase introduction:

DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。

dcase2024有10个主题的任务:

Task 1

Data-Efficient Low-Complexity Acoustic Scene Classification

数据高效的,低复杂度的,声学场景分类

Task 2

First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring

首次无监督的异音检测,用于设备状态监测

Task 3

Audio and audiovisual sound event localization and detection with source distance estimation

具有音频源头距离估计的 音频和视听声音事件 定位和检测

Task 4

Sound event detection with heterogeneous training dataset and potentially missing labels

使用异构训练数据集和潜在缺失标签的声音事件检测

Task 5

Few-shot Bioacoustic Event Detection

小样本生物声学事件检测

Task 6

Automated Audio Captioning

自动生成音频字母

Task 7

Sound Scene Synthesis

声景合成

Task 8

Language-Based Audio Retrieval

基于语言的音频检索

Task 9

Language-Queried Audio Source Separation

基于语言查询的音频源分离

Task 10

Acoustic-based traffic monitoring

基于声学的交通监控

和工业智能比较相关的是task2和task4

ASD

异音检测ASD,即 Anomalous Sound Detection 。

人耳听音的缺点:

  • 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
  • 人疲劳的时候,会误判
  • 长期听音对人耳会造成不可逆的伤害

硬件设备

麦克风

听诊器

声级计(异音一般在频谱中很抢眼)

频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。

也会使用振动加速度传感器。

产品商

https://www.ntiaudio.cn/

https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍

https://www.puseng.net/ant-test

https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍

方法

频谱检测

高次谐波失真面积计算

斜率突变计算

常用模型:HMM GMM

常用特征:MFCC MPEG-7

reference:https://blog.csdn.net/yjjat1989/article/details/44961279

制造业应用场景

基于声信号进行结构损伤检测

托辊异常声音检测

电极压缩机异音检测

刀具磨损状态监控

判定轴承与齿轮等是否异常

压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位

zenodo

再分享一下zenodo平台,

Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献

reference:

https://zhuanlan.zhihu.com/p/646962108

音频事件检测

reference:

https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。

相关推荐
美狐美颜sdk7 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
melonbo10 小时前
使用FFmpeg将H.264码流封装为MP4
ffmpeg·音视频·h.264
aqi0012 小时前
FFmpeg开发笔记(七十七)Android的开源音视频剪辑框架RxFFmpeg
android·ffmpeg·音视频·流媒体
慢行的骑兵14 小时前
Android音视频探索之旅 | CMake基础语法 && 创建支持Ffmpeg的Android项目
ffmpeg·音视频
Just_Paranoid14 小时前
华为云Flexus+DeepSeek征文|基于Dify构建音视频内容转录工作流
华为云·音视频·dify·maas·deepseek·flexusx
go546315846515 小时前
修改Spatial-MLLM项目,使其专注于无人机航拍视频的空间理解
人工智能·算法·机器学习·架构·音视频·无人机
叹一曲当时只道是寻常18 小时前
Softhub软件下载站实战开发(十):实现图片视频上传下载接口
golang·go·音视频
音视频牛哥20 小时前
计算机视觉的新浪潮:扩散模型(Diffusion Models)技术剖析与应用前景
人工智能·计算机视觉·ai·音视频·实时音视频·扩散模型
电子科技圈21 小时前
SmartDV推出先进的H.264和H.265视频编码器和解码器IP
音视频·h.265·h.264
feiyangqingyun1 天前
Qt音视频开发技巧/推流带旋转角度/rtsprtmp推流/保存文件到MP4/拉流解析旋转角度
qt·音视频·qt旋转角度推流