基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

  • 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)

  • 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好

  • 设阈值,-30dB 以下的点全部去掉

  • 3.5kHz 以下的点全部去掉

  • 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的

  • DBSCAN 聚类,去掉一些噪声(小的聚类)

  • 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音

相关推荐
AI创界者7 分钟前
零门槛部署!MOSS-TTS 语音合成与音色克隆本地整合包发布(支持 API/低显存)
人工智能
IT 行者15 分钟前
LangChain4j 集成 Redis 向量存储:我踩过的坑和选型建议
java·人工智能·redis·后端
YuanDaima204817 分钟前
LangChain基础配置与对话模型实战
人工智能·python·langchain·大模型·智能体·langgraph
团子和二花23 分钟前
Mem0:给 AI Agent 装上「长期记忆」
人工智能
chase。24 分钟前
【学习笔记】基于扩散模型的运动规划学习与适应
人工智能·笔记·学习
机器觉醒时代27 分钟前
RL Token:破解 VLA “最后一厘米”精度难题,在线强化学习实现机器人精准操控
人工智能·机器人·强化学习·具身智能·vla模型
Thomas.Sir27 分钟前
第三章:RAG知识库开发之【RAG系统工作流程详细解析:从数据源到智能问答的全链路实战指南】
人工智能·ai·rag·离线处理·在线查询
电子科技圈37 分钟前
Durin:Aliro标准赋能,打造无缝移动入户体验
人工智能·mcu·物联网·网络协议·智能家居·智能硬件·iot
AI先驱体验官1 小时前
AI智能体赛道新机遇:2026机会与挑战深度解析
大数据·人工智能·深度学习·重构·aigc
YUNDUANNET1 小时前
AI驱动,不止于概念 | VeryCloud联合亚马逊云科技深度解读OpenClaw开发范式革命
人工智能·科技·openclaw