技术栈
ai 语音
矜辰所致
11 天前
ffmpeg
·
ai 语音
·
嵌入式语音
·
语音播放
·
语音采样
嵌入式语音开发应用基础说明
博主之前也没有太深入了解过嵌入式语音有关的应用,之前做的语音项目都直接使用的成品语音模块,最近遇到了需要低成本的解决方案,所以还得来了解一下嵌入式语音开发的一些基本内容,毕竟理论了解是我们在后期做语音应用时候的根本 。
姚家湾
1 年前
人工智能
·
播客
·
ai 语音
语音技术在播客领域的应用(2)
播客是以语音为主,各种基于AI 的语音技术在播客领域十分重要。Whisper 是OpenAI 推出的开源语音辨识工具,可以把音档转成文字,支援超过50 种语言。这款工具是基于68 万小时的训练资料,其中包含11.7 万小时的多语言语音数据,涵盖了96 种不同语言。由于资料量庞大,Whisper 在英文的识别精准度相当高,而中文的错误率(Word Error Rate, WER)大约是14.7%,表现也不俗。
我是有底线的