基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

  • 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)

  • 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好

  • 设阈值,-30dB 以下的点全部去掉

  • 3.5kHz 以下的点全部去掉

  • 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的

  • DBSCAN 聚类,去掉一些噪声(小的聚类)

  • 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音

相关推荐
风象南7 小时前
我把大脑开源给了AI
人工智能·后端
Johny_Zhao9 小时前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
飞哥数智坊9 小时前
我帮你读《一人公司(OPC)发展研究》
人工智能
冬奇Lab13 小时前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
没事勤琢磨15 小时前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户51914958484515 小时前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人52815 小时前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆15 小时前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
BugShare15 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心16 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai