基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

  • 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)

  • 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好

  • 设阈值,-30dB 以下的点全部去掉

  • 3.5kHz 以下的点全部去掉

  • 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的

  • DBSCAN 聚类,去掉一些噪声(小的聚类)

  • 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音

相关推荐
程序员陆通1 小时前
独立开发A/B测试实用教程
人工智能·ai编程
knowfoot1 小时前
硬核拆解!跟着公式“走”一遍,你也能彻底看懂神经网络
人工智能·神经网络
FF-Studio1 小时前
大语言模型(LLM)课程学习(Curriculum Learning)、数据课程(data curriculum)指南:从原理到实践
人工智能·python·深度学习·神经网络·机器学习·语言模型·自然语言处理
DDDDDouble1 小时前
<二>Sping-AI alibaba 入门-记忆聊天及持久化
java·人工智能
PyAIExplorer1 小时前
图像处理中的插值方法:原理与实践
图像处理·人工智能
狗头大军之江苏分军1 小时前
疑似华为盘古AI大模型翻车造假风波【实时记录篇】
人工智能·机器学习·程序员
Mr.Winter`1 小时前
轨迹优化 | 基于激光雷达的欧氏距离场ESDF地图构建(附ROS C++仿真)
c++·人工智能·机器人·自动驾驶·ros·ros2·具身智能
机器之心2 小时前
刚刚,苹果基础模型团队负责人庞若鸣被Meta挖走!加入超级智能团队、年薪千万美元
人工智能
G.E.N.3 小时前
开源!RAG竞技场(2):标准RAG算法
大数据·人工智能·深度学习·神经网络·算法·llm·rag