听一听语音助手的声音

分享自制树莓派语音助手的博文也有一些日子了,今天咱们来听听语音助手自己的声音。

上图是本次对话的log记录,从图上可以看到,主要的对话耗时是用于录音(默认5秒)和语音识别(平均5秒)这两个组件上。

就像在博文《sherpa-ncnn 语言模型简单对比_sherpa-ncnn-streaming-zipformer-bilingual-zh-en-CSDN博客》所列,目前我用的sherpa-ncnn的中文模型的size是small,但在我的这块18年买的树莓派上,其识别的耗时依旧还要4-5秒(官网演示材料显示的耗时是0.8秒)。我的期望值是降到1-2秒左右。如果有知道怎么提升这个识别速度的朋友,还请不吝告知。

除了语音识别耗时外,听录音的时候,你还会发现,espeak的发声的确会非常机械。当然,当它在念出一长串功能名的时候,我竟然还有一种听相声报菜单的赶脚。本来是想借上周重装系统的机会把TTS也换一下,依旧还是树莓派系统原因,相应的高版本的tensorflow、torch等我都装不了,也就只能继续用espeak将就了。

好了,废话就写这么多了。最后奉上完整的音频连接。

语音助手的自我介绍


相关推荐
weixin_4684668518 天前
树莓派32位与64位系统安装teamviewer远程软件
linux·单片机·自动化·树莓派·远程控制·vnc·teamviewer
算法打盹中18 天前
基于树莓派与Jetson Nano集群的实验边缘设备上视觉语言模型(VLMs)的性能评估与实践探索
人工智能·计算机视觉·语言模型·自然语言处理·树莓派·多模态·jetson nano
小草cys19 天前
在树莓派集群上部署 Distributed Llama (Qwen 3 14B) 详细指南
python·llama·树莓派·qwen
ShiMetaPi1 个月前
紫光同创Logos2+RK3568JHF开发板:国产异构计算平台的破局者
嵌入式硬件·fpga开发·鸿蒙系统·树莓派
专家大圣2 个月前
轻量级远程开发利器:Code Server与cpolar协同实现安全云端编码
网络·docker·树莓派·香橙派·casaos·code server
乌恩大侠2 个月前
60G毫米波雷达树莓派扩展板
物联网·5g·树莓派·雷达·树莓派扩展板
Learn-Share_HY2 个月前
[Raspberry Pi]如何將無頭虛擬顯示器服務(headless display)建置在樹莓派的Ubuntu桌面作業系統中?
物联网·ubuntu·bash·树莓派·嵌入式系统·无头headless·vnc服务
想躺在地上晒成地瓜干3 个月前
树莓派超全系列教程文档--(66)rpicam-apps可用选项介绍之视频选项
树莓派·摄像头·raspberrypi·树莓派教程·拍视频
想躺在地上晒成地瓜干3 个月前
树莓派超全系列教程文档--(57)如何设置 Apache web 服务器
服务器·apache·树莓派·raspberrypi·树莓派教程
想躺在地上晒成地瓜干3 个月前
树莓派超全系列教程文档--(64)rpicam-apps可用选项介绍之相机控制选项
数码相机·树莓派·摄像头·raspberrypi·树莓派教程