基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

  • 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)

  • 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好

  • 设阈值,-30dB 以下的点全部去掉

  • 3.5kHz 以下的点全部去掉

  • 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的

  • DBSCAN 聚类,去掉一些噪声(小的聚类)

  • 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音

相关推荐
2603_955279708 分钟前
凝视与遗忘:AI如何定义记忆
人工智能
MartinYeung523 分钟前
[论文学习] CAMIA:下文感知成员推理攻击
人工智能·深度学习·学习
IT_陈寒23 分钟前
Python多线程的坑,我居然现在才踩到
前端·人工智能·后端
云边云科技_云网融合38 分钟前
零信任安全:数字化时代的企业防护新范式
人工智能·安全·ai
万岳科技系统开发1 小时前
外卖跑腿配送系统如何借助AI提升配送效率?
大数据·人工智能·机器学习
thinking_talk1 小时前
腾讯云AI Agent安全中心综合评测
人工智能·安全·腾讯云
阿拉雷️1 小时前
Prompt工程设计实践:从基础模板到场景化策略
人工智能·语言模型·prompt
Kel1 小时前
MCP 传输链路全链路拆解:从字节流到协议栈的四层架构之旅
人工智能·设计模式·架构
2601_962851741 小时前
计算机毕业设计之基于大数据的企业财务数据分析系统
大数据·人工智能·深度学习·信息可视化·课程设计
魏祖潇1 小时前
DDD 完整指南——AI 时代工程师的第一道秩序分水岭
人工智能·后端