树莓派5:使用SenseVoice进行语音识别

首先声明,树莓派上跑这个项目仅是演示其可行性,性能上别太较真。实测10分钟的英语MP3,从开始识别到出结果返回到UI上大约需要2分钟。作为对比,同样的文件在我PC上用了不到30秒。

SenseVoice的一些操作依赖于ffmpeg,因此需要先sudo apt install ffmpeg。使用最新版的Raspberry OS应该已经自带了。

我是使用Anaconda维护python环境的。树莓派下可以先把Anaconda装了:

bash 复制代码
cd
wget https://repo.anaconda.com/archive/Anaconda3-2025.12-1-Linux-aarch64.sh
sh Anaconda3-2025.12-1-Linux-aarch64.sh

一路yes,除非默认no。(当然全部打yes也不是不可以,只是每次重启后默认都会进conda环境)

启动conda环境:

bash 复制代码
source ~/anaconda3/bin/activate

创建名为sv的虚拟环境并安装SenseVoice:

bash 复制代码
conda create -n sv python=3.10 -y
conda activate sv

git clone https://github.com/FunAudioLLM/SenseVoice.git
cd SenseVoice

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

#如果在有N卡的PC上装(以CUDA 12.4 为例),
pip install -r requirements.txt \
  -i https://pypi.tuna.tsinghua.edu.cn/simple \
  --extra-index-url https://download.pytorch.org/whl/cu124

成功装完后运行很简单:python webui.py 即可。第一次运行时会继续下载一些必备的组件和模型。

但这样只能在树莓派本机上开浏览器操作。如果想在别的PC上访问这个树莓派,可以在启动webui前先修改一下webui.py打开webui.py,找到快结束的地方的"demo.launch()",修改为:

demo.launch(server_name="0.0.0.0",server_port=7860)

这样就可以让任意一台IP可达的PC访问了。SenseVoice使用起来也超简单的:浏览器里输入网址(http://树莓派的IP:7860)、上传mp3文件、选择语言、按下"Start"。稍等片刻后在Result框中复制文本就行了。

后台可以监视到活动。

经测试,x86_64的windows和linux也同样支持。

相关推荐
未来之窗软件服务2 天前
AI人工智能(二十三)错误示范ASR 语音识别C#—东方仙盟练气期
人工智能·c#·语音识别·仙盟创梦ide·东方仙盟
山河君3 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
colicode3 天前
安卓Android语音验证码接口API示例代码:Kotlin/Java版App验证开发
android·java·前端·前端框架·kotlin·语音识别
EasyDSS3 天前
从“听见”到“理解”:EasyDSS视频会议系统智能字幕、语音转写技术的深度剖析
音视频·语音识别·语音转写·ai摘要·点播技术·流媒体直播·智能字幕
开开心心就好6 天前
文字转语音无字数限,对接微软接口比付费爽
java·linux·开发语言·人工智能·pdf·语音识别
OBS插件网6 天前
OBS弹幕助手使用教程:OBS语音读弹幕语音播报插件下载安装教程
人工智能·语音识别
阿林来了7 天前
Flutter三方库适配OpenHarmony【flutter_speech】— 持续语音识别与长录音
flutter·语音识别·harmonyos
开开心心就好7 天前
免费音频转文字工具,绿色版离线多模型可用
人工智能·windows·计算机视觉·计算机外设·ocr·excel·语音识别
OBS插件网10 天前
OBS直播如何给人脸加口罩特效?OBS口罩特效插件下载安装教程
人工智能·数码相机·语音识别·产品经理
阿林来了11 天前
Flutter三方库适配OpenHarmony【flutter_speech】— 语音识别停止与取消
flutter·语音识别·harmonyos