【使用机器学习和深度学习对城市声音进行分类】基于两种技术(ML和DL)对音频数据(城市声音)进行分类(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥

****🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。

⛳️**座右铭:**行百里者,半于九十。

📋📋📋++本文目录如下:++🎁🎁🎁

目录

[💥1 概述](#💥1 概述)

[📚2 运行结果](#📚2 运行结果)

[2.1 算例1](#2.1 算例1)

[2.2 算例2](#2.2 算例2)

[2.3 算例3](#2.3 算例3)

[2.4 算例4](#2.4 算例4)

[2.5 算例5](#2.5 算例5)

[2.6 算例6](#2.6 算例6)

[🎉3 参考文献](#🎉3 参考文献)

[🌈4 Matlab代码实现](#🌈4 Matlab代码实现)


💥1 概述

使用机器学习和深度学习对城市声音进行分类是一个有趣的研究课题。下面是一种基本的方法,结合了机器学习(ML)和深度学习(DL)技术:

  1. 数据收集和预处理:收集大量城市声音的音频数据集。可以使用麦克风或其他录音设备在不同城市环境下进行采集。确保采集到的音频数据有足够的多样性和代表性。对音频数据进行预处理,如音频剪辑、采样率调整、去噪等。

  2. 特征提取:从音频数据中提取有代表性的特征向量。可以使用机器学习常见的音频特征提取方法,如Mel频谱系数(MFCC)、音频能量、过零率等。这些特征可以帮助机器学习和深度学习模型发现城市声音的区别和模式。

  3. 机器学习分类:使用机器学习算法对提取的音频特征进行分类。选择适合音频分类的机器学习算法,如支持向量机(SVM)、随机森林(Random Forest)或K最近邻(K-Nearest Neighbors)等。使用预处理的音频数据和特征向量训练机器学习模型,并对其进行评估和优化。

  4. 深度学习分类:构建深度学习模型进行城市声音分类。使用深度学习算法,如卷积神经网络(CNN)或循环神经网络(RNN)构建分类模型。使用音频数据的原始波形或经过预处理的特征作为输入,训练深度学习模型并进行模型优化。

  5. 模型评估和比较:使用预留的测试集评估机器学习和深度学习模型的性能。比较两种技术在城市声音分类任务上的准确率、召回率、精确率等指标。根据评估结果选择更有效的模型。

  6. 可解释性分析:对分类结果进行可解释性分析。了解哪些特征对城市声音的分类起到重要作用,或者使用可解释性方法(如Grad-CAM)来查看深度学习模型对城市声音的决策过程。

  7. 模型优化和改进:根据分析结果和实际需求,对机器学习和深度学习模型进行优化和改进。可以尝试使用更复杂的模型架构、调整超参数或增加数据样本等来提高模型的性能。

通过上述方法,可以使用机器学习和深度学习技术对城市声音进行分类。机器学习方法适用于特征提取和分类,而深度学习方法可以直接处理原始音频数据,从而更好地捕捉城市声音的特征和模式。结合两种技术可以提高分类的准确性和效果,对于城市环境监测、噪音控制等方面具有实际应用价值。

该数据集包含来自 8732 个类的 4 个城市声音摘录(<=10 秒),它们是:

空调

汽车喇叭

儿童玩耍

狗吠

钻井

引擎 怠速

枪射击

手提钻

警笛

街头音乐

随附的元数据包含每个声音摘录的唯一 ID 及其给定的类名。随附的 git 存储库中包含此数据集的示例,可以从此处下载完整数据集。

此示例中有 7 个算例:

算例 1:示例简介,探索和可视化数据

算例 2:使用诊断应用程序设计器对数据

进行预处理和提取功能(信号时域特征和频谱特征)

算例 3:模型训练和评估

算例 4:模型部署

算例 5:使用 MFCC 提取特征来训练机器学习模型

算例 6:使用小波分析和深度学习对城市声音进行分类

亮点 :

为音频数据存储

准备现实数据 标准化和规范化数字信号数据(采样率、位深度、通道数) 使用不同的方法提取特征(时域信号特征和频谱特征,MFCC,离散小波变换,Haar 1D小波变换)

📚 2 运行结果

2.1 算例1

figure()

datafolder = "UrbanSound8K/structure1";

currentfolder = pwd;

cd(datafolder);

listdir=dir;

for i=3:1:length(listdir)

cd(listdir(i).name)

inside=dir;

subplot(3,4,i-2);

[y,fs]=audioread(inside(4).name);

plot(y(:,:));

soundsc(y(:,:),fs);

grid on;

title(listdir(i).name)

drawnow;

pause(2)

cd(strcat(currentfolder,'\',datafolder));

end

2.2 算例2

figure()

datafolder = "UrbanSound8K/structure";

currentfolder = pwd;

cd(datafolder);

listdir=dir;

for i=3:1:length(listdir)

cd(listdir(i).name)

inside=dir;

subplot(3,4,i-2);

[y,fs]=audioread(inside(randi([4,100])).name);

plot(y(:,:));

soundsc(y(:,:),fs);

grid on;

title(listdir(i).name)

drawnow;

pause(2)

cd(strcat(currentfolder,'\',datafolder));

end

2.3 算例3

2.4 算例4

2.5 算例5

figure()

datafolder = "UrbanSound8K/structure";

currentfolder = pwd;

cd(datafolder);

listdir=dir;

for i=3:1:length(listdir)

cd(listdir(i).name)

inside=dir;

subplot(3,4,i-2);

[y,fs]=audioread(inside(4).name);

plot(y(:,:));

soundsc(y(:,:),fs);

grid on;

title(listdir(i).name)

drawnow;

pause(5)

cd(strcat(currentfolder,'\',datafolder));

end

2.6 算例6

🎉3 参考文献

部分理论来源于网络,如有侵权请联系删除。

[1]HP ProLiant ML和DL服务器选用QLogic的第三代CNA产品[J].计算机与网络,2011,37(Z1):127.

[2]Kevin Chng (2023). Classify Urban Sound using Machine Learning & Deep Learning

[3]崔琳. 音频标记深度神经网络模型研究[D].燕山大学,2020.DOI:10.27440/d.cnki.gysdu.2020.001881.

🌈4 Matlab代码实现

相关推荐
YRr YRr8 分钟前
深度学习:Transformer Decoder详解
人工智能·深度学习·transformer
知来者逆13 分钟前
研究大语言模型在心理保健智能顾问的有效性和挑战
人工智能·神经网络·机器学习·语言模型·自然语言处理
Shy96041817 分钟前
Bert完形填空
python·深度学习·bert
老艾的AI世界35 分钟前
新一代AI换脸更自然,DeepLiveCam下载介绍(可直播)
图像处理·人工智能·深度学习·神经网络·目标检测·机器学习·ai换脸·视频换脸·直播换脸·图片换脸
浊酒南街1 小时前
吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)4.9-4.10
人工智能·深度学习·神经网络·cnn
懒惰才能让科技进步1 小时前
从零学习大模型(十二)-----基于梯度的重要性剪枝(Gradient-based Pruning)
人工智能·深度学习·学习·算法·chatgpt·transformer·剪枝
没有不重的名么2 小时前
门控循环单元GRU
人工智能·深度学习·gru
love_and_hope2 小时前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
Chef_Chen2 小时前
从0开始学习机器学习--Day14--如何优化神经网络的代价函数
神经网络·学习·机器学习
学术头条2 小时前
AI 的「phone use」竟是这样练成的,清华、智谱团队发布 AutoGLM 技术报告
人工智能·科技·深度学习·语言模型