听一听语音助手的声音

分享自制树莓派语音助手的博文也有一些日子了,今天咱们来听听语音助手自己的声音。

上图是本次对话的log记录,从图上可以看到,主要的对话耗时是用于录音(默认5秒)和语音识别(平均5秒)这两个组件上。

就像在博文《sherpa-ncnn 语言模型简单对比_sherpa-ncnn-streaming-zipformer-bilingual-zh-en-CSDN博客》所列,目前我用的sherpa-ncnn的中文模型的size是small,但在我的这块18年买的树莓派上,其识别的耗时依旧还要4-5秒(官网演示材料显示的耗时是0.8秒)。我的期望值是降到1-2秒左右。如果有知道怎么提升这个识别速度的朋友,还请不吝告知。

除了语音识别耗时外,听录音的时候,你还会发现,espeak的发声的确会非常机械。当然,当它在念出一长串功能名的时候,我竟然还有一种听相声报菜单的赶脚。本来是想借上周重装系统的机会把TTS也换一下,依旧还是树莓派系统原因,相应的高版本的tensorflow、torch等我都装不了,也就只能继续用espeak将就了。

好了,废话就写这么多了。最后奉上完整的音频连接。

语音助手的自我介绍


相关推荐
曦月合一10 天前
树莓派安装jdk、tomcat、vnc、谷歌浏览器开机自启等环境配置
java·tomcat·树莓派
天月风沙22 天前
Betaflight飞控、树莓派RP2350B主控编译教程
linux·单片机·嵌入式硬件·mcu·无人机·树莓派
MIXLLRED24 天前
解决:RealSense D435 在树莓派4B(Ubuntu 22.04 + ROS2 Humble)上的权限与驱动问题完整复盘
linux·ubuntu·树莓派·realsense d400
weixin_426689201 个月前
RP2040和RP2350的laungch文件
树莓派
MIXLLRED1 个月前
树莓派4B(Ubuntu 22.04 Jammy arm64)上从源码编译安装 librealsense
ubuntu·树莓派·librealsense
weixin_426689201 个月前
VSCODE 树莓派C语言开发环境建立
vscode·树莓派
衡动科技1 个月前
Ubuntu 22.04/24.04 安装 ROS2 完整教程(Humble / Jazzy)
ubuntu·树莓派·ros2
困死,根本不会2 个月前
树莓派 SSH 连接排错实录:从 IP 网段到主机密钥变更,再到 VNC 自启动
开发语言·ssh·php·树莓派
困死,根本不会2 个月前
Windows下模拟树莓派:使用ble-serial创建虚拟串口实现手机蓝牙通信
windows·python·单片机·嵌入式硬件·树莓派
Java烘焙师2 个月前
AI编程实战:从零到一搭建全栈项目
java·架构·树莓派·ai实战