人工智能应用-机器听觉: 05.基于模式匹配的语音识别

早期的语音识别技术就是基于"不同发音的共振峰不同"这一原理,通过分析语音的共振峰来区分不同的发音。1952 年,AT&T 公司的科学家首次利用语音的第一和第二共振峰实现了对十个英文数字的识别。如图 所示,每个小图对应一个数字,横轴表示第一共振峰F1,纵轴表示第二共振峰F2。图中的曲线展示了发音时共振峰的变化轨迹。可以看到,不同数字在 F1-F2 平面上形成了独特的轨迹。AT&T 的研究者正是利用这些轨迹上的差异,实现了对不同数字的有效区分

AT&T 的数字识别方法。图片来源:Davis et al., 1952.

相关推荐
NAGNIP4 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab5 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab5 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP9 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年9 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼9 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS9 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区10 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈10 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang11 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx