【工业智能】音频信号相关场景

【工业智能】音频信号相关场景

与计算机视觉CV相对应,计算机听觉computer audition,简称CA。

Dcase

这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)

https://dcase.community/

Dcase introduction:

DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。

dcase2024有10个主题的任务:

Task 1

Data-Efficient Low-Complexity Acoustic Scene Classification

数据高效的,低复杂度的,声学场景分类

Task 2

First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring

首次无监督的异音检测,用于设备状态监测

Task 3

Audio and audiovisual sound event localization and detection with source distance estimation

具有音频源头距离估计的 音频和视听声音事件 定位和检测

Task 4

Sound event detection with heterogeneous training dataset and potentially missing labels

使用异构训练数据集和潜在缺失标签的声音事件检测

Task 5

Few-shot Bioacoustic Event Detection

小样本生物声学事件检测

Task 6

Automated Audio Captioning

自动生成音频字母

Task 7

Sound Scene Synthesis

声景合成

Task 8

Language-Based Audio Retrieval

基于语言的音频检索

Task 9

Language-Queried Audio Source Separation

基于语言查询的音频源分离

Task 10

Acoustic-based traffic monitoring

基于声学的交通监控

和工业智能比较相关的是task2和task4

ASD

异音检测ASD,即 Anomalous Sound Detection 。

人耳听音的缺点:

  • 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
  • 人疲劳的时候,会误判
  • 长期听音对人耳会造成不可逆的伤害

硬件设备

麦克风

听诊器

声级计(异音一般在频谱中很抢眼)

频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。

也会使用振动加速度传感器。

产品商

https://www.ntiaudio.cn/

https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍

https://www.puseng.net/ant-test

https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍

方法

频谱检测

高次谐波失真面积计算

斜率突变计算

常用模型:HMM GMM

常用特征:MFCC MPEG-7

reference:https://blog.csdn.net/yjjat1989/article/details/44961279

制造业应用场景

基于声信号进行结构损伤检测

托辊异常声音检测

电极压缩机异音检测

刀具磨损状态监控

判定轴承与齿轮等是否异常

压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位

zenodo

再分享一下zenodo平台,

Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献

reference:

https://zhuanlan.zhihu.com/p/646962108

音频事件检测

reference:

https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。

相关推荐
RTC实战笔记3 天前
实时互动数字人怎么做,才不是一个只会说话的视频?
音视频·数字人·rtc·数字人接入
RTC实战笔记15 天前
Android 实时音视频接入教程:媒体补充增强信息(SEI)
音视频·媒体·rtc
潜创微科技16 天前
HDMI1.3 无线传输芯片方案 空旷 150 米量产级音视频方案
音视频
VidDown16 天前
VidDown 工具站:免费、本地优先的开发者工具箱
javascript·编辑器·音视频·视频编解码·视频
换个昵称都难16 天前
音频格式之WAV
音视频
AI创界者16 天前
PilotTTS 一键整合包(Win/Mac):8G 显存畅跑,实测解锁情绪与副语言的精准控制
人工智能·macos·aigc·音视频
u1521096484916 天前
S.S.Audio PRO A2音频隔离器
嵌入式硬件·音视频·实时音视频·视频编解码·视频
VidDown16 天前
显卡处理视频技术详解:从硬解码到 NVENC,GPU 如何让视频处理起飞?
javascript·编辑器·音视频·视频编解码·视频
EasyDSS16 天前
全能音视频平台/私有化音视频系统EasyDSS!直播/点播/会议/集群对讲一站式落地
音视频
Damon_X16 天前
车载音频复习
音视频