基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

  • 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)

  • 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好

  • 设阈值,-30dB 以下的点全部去掉

  • 3.5kHz 以下的点全部去掉

  • 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的

  • DBSCAN 聚类,去掉一些噪声(小的聚类)

  • 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音

相关推荐
A尘埃11 小时前
项目三:信息抽取与图谱问答(医疗科研文献知识图谱与智能问答平台)
人工智能·windows·知识图谱
鹿鸣悠悠11 小时前
AI测试(含大模型)与普通测试的区别及实施方法
人工智能
闲看云起11 小时前
一文了解RoPE(旋转位置编码)
人工智能·语言模型·自然语言处理
whaosoft-14311 小时前
51c视觉~合集50
人工智能
金紫火11 小时前
美团CatPaw:一款AI驱动的编程工具解析
人工智能
sensen_kiss11 小时前
INT305 Machine Learning 机器学习 Pt.6 卷积神经网络(Convolutional Neural Network)
机器学习·计算机视觉·cnn
996终结者11 小时前
深度学习从入门到精通(一):深度学习的分类
人工智能·深度学习·分类
长桥夜波11 小时前
【第二十一周】机器学习周报
人工智能·机器学习
GIOTTO情11 小时前
舆情处置技术深度解析:Infoseek 字节探索的 AI 闭环架构与实现逻辑
人工智能·架构
KG_LLM图谱增强大模型12 小时前
突破AI助手成本壁垒:知识图谱思维架构让小模型实现大性能
人工智能·架构·大模型·知识图谱·graphrag