听一听语音助手的声音

分享自制树莓派语音助手的博文也有一些日子了,今天咱们来听听语音助手自己的声音。

上图是本次对话的log记录,从图上可以看到,主要的对话耗时是用于录音(默认5秒)和语音识别(平均5秒)这两个组件上。

就像在博文《sherpa-ncnn 语言模型简单对比_sherpa-ncnn-streaming-zipformer-bilingual-zh-en-CSDN博客》所列,目前我用的sherpa-ncnn的中文模型的size是small,但在我的这块18年买的树莓派上,其识别的耗时依旧还要4-5秒(官网演示材料显示的耗时是0.8秒)。我的期望值是降到1-2秒左右。如果有知道怎么提升这个识别速度的朋友,还请不吝告知。

除了语音识别耗时外,听录音的时候,你还会发现,espeak的发声的确会非常机械。当然,当它在念出一长串功能名的时候,我竟然还有一种听相声报菜单的赶脚。本来是想借上周重装系统的机会把TTS也换一下,依旧还是树莓派系统原因,相应的高版本的tensorflow、torch等我都装不了,也就只能继续用espeak将就了。

好了,废话就写这么多了。最后奉上完整的音频连接。

语音助手的自我介绍


相关推荐
少年、潜行3 天前
树莓派3B+驱动开发(8)- i2c控制PCF8591
驱动开发·树莓派·3b+
少年、潜行9 天前
树莓派3B+驱动开发(2)- LED驱动(传统模式)
驱动开发·树莓派·3b+
__只是为了好玩__19 天前
物品识别 树莓派 5 YOLO v5 v8 v10 11 计算机视觉
人工智能·yolo·计算机视觉·ai·树莓派
路人甲ing..20 天前
树莓派明明安装了opencv和numpy,却找不到
人工智能·opencv·numpy·树莓派·安装包
路人甲ing..20 天前
在树莓派上使用自带的摄像头采集视频
python·opencv·树莓派·摄像头·微处理器
xm一点不soso21 天前
小车AI视觉交互--2.颜色跟随
人工智能·计算机视觉·交互·树莓派·视觉小车
断水客21 天前
如何使用 systemd 文件实现自启动
嵌入式·树莓派
Bowen_CV22 天前
智能产品综合开发 - 智能家居(智能语音机器人)
人工智能·python·机器人·智能家居·树莓派
少年、潜行22 天前
基于树莓派3B+的简易智能家居小项目(WiringPi库 + C语言开发)
c语言·智能家居·树莓派·3b+
skywalk81631 个月前
树莓派2 安装raspberry os 并修改成固定ip
linux·服务器·网络·debian·树莓派·raspberry