【工业智能】音频信号相关场景

【工业智能】音频信号相关场景

与计算机视觉CV相对应,计算机听觉computer audition,简称CA。

Dcase

这里推荐一个社区:DCASE(Detection and Classification of Acoustic Scenes and Events)

https://dcase.community/

Dcase introduction:

DCASE 2023研讨会是第八次声学场景和事件的检测和分类研讨会,与DCASE挑战赛一起组织。该研讨会旨在为从事声音事件计算分析和场景分析的研究人员提供一个展示和讨论其结果的场所。目标是将来自许多不同大学和公司的对该主题感兴趣的研究人员聚集在一起,并提供科学交流思想和意见的机会。

dcase2024有10个主题的任务:

Task 1

Data-Efficient Low-Complexity Acoustic Scene Classification

数据高效的,低复杂度的,声学场景分类

Task 2

First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring

首次无监督的异音检测,用于设备状态监测

Task 3

Audio and audiovisual sound event localization and detection with source distance estimation

具有音频源头距离估计的 音频和视听声音事件 定位和检测

Task 4

Sound event detection with heterogeneous training dataset and potentially missing labels

使用异构训练数据集和潜在缺失标签的声音事件检测

Task 5

Few-shot Bioacoustic Event Detection

小样本生物声学事件检测

Task 6

Automated Audio Captioning

自动生成音频字母

Task 7

Sound Scene Synthesis

声景合成

Task 8

Language-Based Audio Retrieval

基于语言的音频检索

Task 9

Language-Queried Audio Source Separation

基于语言查询的音频源分离

Task 10

Acoustic-based traffic monitoring

基于声学的交通监控

和工业智能比较相关的是task2和task4

ASD

异音检测ASD,即 Anomalous Sound Detection 。

人耳听音的缺点:

  • 人的主观因素大,同一个声音,有的人觉得有问题,有的人觉得没问题;
  • 人疲劳的时候,会误判
  • 长期听音对人耳会造成不可逆的伤害

硬件设备

麦克风

听诊器

声级计(异音一般在频谱中很抢眼)

频谱检测对机械振动/异音检测尤其有效,但对于扬声器这种由外部信号激发发声的电声产品就不太奏效。电声测试需要完整的信号激励和分析系统。

也会使用振动加速度传感器。

产品商

https://www.ntiaudio.cn/

https://baijiahao.baidu.com/s?id=1642468411707097318 内含方案介绍

https://www.puseng.net/ant-test

https://t.cj.sina.com.cn/articles/view/3009742660/vb3650744019015jm6 方案介绍

方法

频谱检测

高次谐波失真面积计算

斜率突变计算

常用模型:HMM GMM

常用特征:MFCC MPEG-7

reference:https://blog.csdn.net/yjjat1989/article/details/44961279

制造业应用场景

基于声信号进行结构损伤检测

托辊异常声音检测

电极压缩机异音检测

刀具磨损状态监控

判定轴承与齿轮等是否异常

压力管道、容器泄露(石油管道,热力管道,压力锅炉)和定位

zenodo

再分享一下zenodo平台,

Zenodo作为一个开放获取的数字存储库和数据存储平台,可以看相关文献

reference:

https://zhuanlan.zhihu.com/p/646962108

音频事件检测

reference:

https://zhuanlan.zhihu.com/p/343528946 展示效果好,并且有开源代码。

相关推荐
ai产品老杨1 小时前
深度解析:基于国产化异构计算的 AI 视频管理平台架构——从 GB28181 接入到 NPU 边缘推流的解耦实践
人工智能·架构·音视频
watson_pillow1 小时前
音视频相关基础知识储备入门-字幕
音视频
程序员JerrySUN2 小时前
Jetson边缘嵌入式实战课程第二讲:JetPack 和 SDK Manager 是什么
c语言·开发语言·网络·udp·音视频
weixin_6684 小时前
NVIDIA VSSVideo Search and Summarization视频搜索与摘要蓝图详尽使用说明与技术报告版本
人工智能·音视频
jiayong235 小时前
国内外视频/图像大模型与智能体工具平台竞品对比
ai·音视频·agent
视频技术分享5 小时前
技术赋能生态革新:音视频产业开启千亿增长新周期 视频会议成核心增长亮点
音视频
reasonsummer6 小时前
【教学类-160-14】20260425 AI视频培训-练习014“豆包AI视频《月下枯蔷(哥特风)》+豆包图片风格:油画”
人工智能·音视频·豆包
AI服务老曹6 小时前
深度解析:支持 GB28181/RTSP 及异构计算(X86/ARM+GPU/NPU)的 AI 视频管理平台架构方案(附源码交付与 Docker 部署)
arm开发·人工智能·音视频
byte轻骑兵7 小时前
【LE Audio】BASS精讲[5]: 状态特征解析,广播接收状态实时可视全流程
人工智能·算法·音视频·语音识别·le audio·低功耗音频