【工业智能】音频信号相关场景

【工业智能】音频信号相关场景

与计算机视觉CV相对应,计算机听觉computer audition,简称CA。

Dcase

这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)

https://dcase.community/

Dcase introduction:

DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。

dcase2024有10个主题的任务:

Task 1

Data-Efficient Low-Complexity Acoustic Scene Classification

数据高效的,低复杂度的,声学场景分类

Task 2

First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring

首次无监督的异音检测,用于设备状态监测

Task 3

Audio and audiovisual sound event localization and detection with source distance estimation

具有音频源头距离估计的 音频和视听声音事件 定位和检测

Task 4

Sound event detection with heterogeneous training dataset and potentially missing labels

使用异构训练数据集和潜在缺失标签的声音事件检测

Task 5

Few-shot Bioacoustic Event Detection

小样本生物声学事件检测

Task 6

Automated Audio Captioning

自动生成音频字母

Task 7

Sound Scene Synthesis

声景合成

Task 8

Language-Based Audio Retrieval

基于语言的音频检索

Task 9

Language-Queried Audio Source Separation

基于语言查询的音频源分离

Task 10

Acoustic-based traffic monitoring

基于声学的交通监控

和工业智能比较相关的是task2和task4

ASD

异音检测ASD,即 Anomalous Sound Detection 。

人耳听音的缺点:

  • 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
  • 人疲劳的时候,会误判
  • 长期听音对人耳会造成不可逆的伤害

硬件设备

麦克风

听诊器

声级计(异音一般在频谱中很抢眼)

频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。

也会使用振动加速度传感器。

产品商

https://www.ntiaudio.cn/

https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍

https://www.puseng.net/ant-test

https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍

方法

频谱检测

高次谐波失真面积计算

斜率突变计算

常用模型:HMM GMM

常用特征:MFCC MPEG-7

reference:https://blog.csdn.net/yjjat1989/article/details/44961279

制造业应用场景

基于声信号进行结构损伤检测

托辊异常声音检测

电极压缩机异音检测

刀具磨损状态监控

判定轴承与齿轮等是否异常

压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位

zenodo

再分享一下zenodo平台,

Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献

reference:

https://zhuanlan.zhihu.com/p/646962108

音频事件检测

reference:

https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。

相关推荐
顾北川_野10 小时前
播放PCM音频增益低+单独增强PCM解码的方案
音视频·pcm
Everbrilliant8912 小时前
FFmpeg解码音频数据AudioTrack/OpenSL播放
ffmpeg·音视频·audiotrack·opensl·ffmpeg音频解码播放·decodethread·opensl播放与解码同步
ivy1598683771512 小时前
JM20329是一款高性能、低功耗的USB桥接芯片,实现串行接口(如SATA、IDE)与USB接口之间的数据转换。
c语言·开发语言·ide·嵌入式硬件·eureka·音视频·视频编解码
温暖名字13 小时前
调用qwen3-omni的api对本地文件生成视频文本描述(批量生成)
python·音视频·qwen·qa问答
太阳人79813 小时前
MIPI D-PHY/C-PHY接收器压力眼图测试介绍
功能测试·嵌入式硬件·音视频·硬件工程
blackorbird16 小时前
视频生成类大模型 Sora 2 系统提示提取技术研究
音视频
Android系统攻城狮16 小时前
Android16音频之启动蓝牙SCO链路startBluetoothSco:用法实例(九十六)
音视频·android16·音频进阶·蓝牙sco协议
开开心心就好17 小时前
无需函数:Excel数据筛选工具推荐
xml·网络·pdf·华为云·word·excel·音视频
美狐美颜SDK开放平台1 天前
美颜SDK性能优化实战:GPU加速与AI人脸美型的融合开发
人工智能·音视频
卜锦元1 天前
音视频媒体服务领域中三种架构方式的定义与区别(Mesh、MCU、SFU)
架构·音视频·媒体