基于机器学习的齿音识别

秩序之狐2025-04-01 10:42

因为大一上完就不写matu，好久不更了

但回到CSDN上一看居然还有小灯在关注我，这下不得不写点东西了（）

源于智能嵌入式系统设计的课设。下一步还会继续做，有兴趣的同学可以联系我一起搞嘞（发烧友更好嘻嘻，一起 hifi ，科 hi 党才是最 hifi 的！！），之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github，可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了，应该叫DeEsser，但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品，本质上是对于音频中高于3.5kHz的分量进行削波

人肉特征提取（之后可以改成基于机器学习的特征提取，可以提取到更好的特征）
最大值、最小值、中值、微分滤波器都尝试，微分滤波器效果最好
设阈值，-30dB 以下的点全部去掉
3.5kHz 以下的点全部去掉
膨胀，希望能填充一下，人眼看上去找出的齿音频谱是不连续的
DBSCAN 聚类，去掉一些噪声（小的聚类）
目前，本质上是对 3.5kHz 频率以上的，幅度较大的高频分量进行削波，并没有识别出来齿音

上一篇：第13章案例篇：学成在线

下一篇：提升 Vue 项目开发效率：高阶组件 RenderFunction 的灵活性与实战应用

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结