FunASR实时语音识别Websocket接口在Linux服务器中部署教程

0. 视频效果演示

大家可以先看看效果

Linux中部署FunASR实时语音识别接口

1. 背景介绍

FunASR是阿里巴巴开源一款可以实时语音识别,区分说话人,音频活动性检测等功能的项目,在github中拥有很多的star,大家也可以在github中搜索到这个开源项目。

在做通话语音实时转写,会议语音实时转写中,我们可以部署这个FunASR做为接口提供给公司的项目调用,就犹如你去调用讯飞或者阿里云的API接口一样。

2. 部署过程

这里以Ubuntu系统为例子,你也可以使用其它Linux发行版,并且经过验证支持国产Linux系统。这是以Ubuntu为例子,是因为在这个系统上部署对于我来说更简单,我更熟悉。

首先是下载docker镜像,可以从readme文档中找到最新的下载链接。

这里我上传我之前做四川话ASR的时候拉取的镜像到我的Ubuntu服务器中,并且解压。

shell 复制代码
tar -zxvf asr_docker.tar.gz

解压之后可以看到下面的tar包,然后使用docker命令导入到docker中。

shell 复制代码
docker load -i asr_docker.tar

查看一下是否正常导入

shell 复制代码
docker images

可以看到有这个名为sichuan_asr:v2的镜像。

我们启动这个docker镜像,使用下面的命令

shell 复制代码
docker run -it -p 9090:9090 -p 10095:10095 -v /usr/local/src/asr/models:/workspace/models sichuan_asr:v2

启动后会自动进入到docker内,然后切换路径

shell 复制代码
cd FunASR/runtime

启动websocket接口

shell 复制代码
bash run_server_2pass.sh

最后启动web端,作为演示用,如果你正式上线生产环境,可以不启动下面的web端

shell 复制代码
cd html5 && python h5Server.py --port 9090

现在就可以打开浏览器输入你的公网ip地址加上9090端口,就可以访问到你部署好的实时语音识别项目了。第一次访问会提示不安全,点击"高级",然后点击"继续前往"就可以访问到你部署好的项目了。

注意:你如果部署在阿里云、腾讯云等云服务器中,你需要在控制台的安全组里开放9090端口和10095端口。还有如果你的宿主Linux服务器也开启了防火墙,也需要开放这两个端口。

3. 联系

更多内容可以点击这里访问我的博客
视频演示和部署教程可以访问这里

如需有偿在Linux中部署实时语音识别接口,或者录音转写接口并且区分说话人,可以在上面我的博客中首页联系到我。

相关推荐
marsh020614 小时前
49 openclaw故障排查:系统异常时的诊断方法
服务器·前端·青少年编程·ai·php·技术美术
rising start14 小时前
Linux入门及相关命令
linux·运维·服务器
kyle~14 小时前
机器人感知 --- 多相机传感时间误差分析
linux·c++·数码相机·机器人·ros2·传感器
byzh_rc14 小时前
[自然语言处理-入门] 语音识别
人工智能·自然语言处理·语音识别
minji...14 小时前
Linux 网络基础之传输层协议TCP(九)从内核源码的角度打通系统与网络之间的关系,套接字多态的体现
linux·运维·服务器·网络·网络协议·tcp/ip·http
yyuuuzz14 小时前
独立开发者线上服务运维的几点实践经验
运维·服务器·网络·云计算·aws
想唱rap14 小时前
IO多路转接Select
运维·服务器·网络·数据库·sql·tcp/ip·mysql
樱桃花下的小猫14 小时前
Rust 服务器倍率参数配置指南
服务器·云鸢互联·零门槛一键搭建·新手友好无技术门槛要求·腐蚀rust服务器一键开服·腐蚀rust·腐蚀rust低延迟稳定服务器
深藏bIue14 小时前
MySQL切换服务器数据迁移记录
服务器·mysql·oracle
corpse201015 小时前
CentOS Linux release 8.5.2111下的CVE-2026-31431 Linux内核提权漏洞处置
linux·运维·centos