一、检查docker容器是否启动
1.输入命令 systemctl status docker
启动 systemctl start docker
守护进程重启 sudo systemctl daemon-reload
重启docker服务 systemctl restart docker
重启docker服务 sudo service docker restart
关闭docker service docker stop
关闭docker systemctl stop docker
检查docker状态 systemctl status docker
若docker正常启动则显示界面如下
![](https://file.jishuzhan.net/article/1698262489596170241/b45813ec76df40639f83f6c0f0be522d.png)
2.启动服务时可能出现报错
可能为权限不够导致
输入su,并输入当前用户登录密码即可进入root权限模式,再次启动即可
Docker启动失败报错Failed to start Docker Application Container Engine解决方案
二、docker启动paddlespeech镜像
1.安装
初始需要下载镜像到本地,参照官方文档docker安装paddlespeech,并启动服务
#下载并启动服务
docker run --name dev -v $PWD:/mnt -p xxxx:xxxx -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash
其中xxxx:xxxx,前为端口映射端口,后为实际请求端口
比如想启动paddlespeech基础服务需要将实际请求设置为8090,包含中文语音识别,中文语音合成等等
但此服务语音识别和合成只能识别中文以及数字,字母及英文无法识别,使用需要注意
2.二次使用
docker run -p XXXX:XXXX -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash
使用此命令即可启动paddlespeech镜像
若想查看当前有哪些镜像,使用 docker images 命令即可查看
三、启动paddlespeech服务
1.官方文档说明有三种服务启动方式
#启动AI Studio服务,即包括语音识别,语音合成,音频分类等多种服务
paddlespeech_server start --config_file ./speech_server/conf/application.yaml
#启动完毕,即可看到启动端口为8090
#需要在启动docker镜像时指定实际端口
#启动流式tts服务
paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml
#启动流式asr服务
paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml
启动成功后应该显示
[2023-05-02 07:16:34,644] [ INFO] - start to init the engine
[2023-05-02 07:16:34,644] [ INFO] - asr : python engine.
W0502 07:16:37.497296 1187 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver API Version: 12.1, Runtime API Version: 11.7
W0502 07:16:37.502528 1187 gpu_resources.cc:91] device: 0, cuDNN Version: 8.8.
2023-05-02 07:16:38.195 | INFO | paddlespeech.s2t.modules.embedding:__init__:153 - max len: 5000
[2023-05-02 07:16:39,064] [ INFO] - Initialize ASR server engine successfully on device: gpu:0.
[2023-05-02 07:16:39,064] [ INFO] - tts : python engine.
...
[2023-05-02 07:16:55] [INFO] [on.py:61] Application startup complete.
INFO: Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
[2023-05-02 07:16:55] [INFO] [server.py:212] Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
2.若想使用中英文混合语音合成可以使用飞浆另一个产品PP-TTS飞浆文档
这里不多做说明,需要自行文档查阅
四、使用服务
1.使用以上服务可以有三种方法验证
1、命令行
2、api接口
3、python程序调用
此文档 paddlespeech正常服务使用方法 具体说明每一种使用方式
若想使用流式tts和流式asr服务请参考以下文档
https://github.com/PaddlePaddle/PaddleSpeech/wiki/PaddleSpeech-Server-RESTful-API
PaddleSpeech Server WebSocket API · PaddlePaddle/PaddleSpeech Wiki · GitHub
使用postman请求,并带body参数请求服务,需要注意请求类型,正常服务一般为post请求
2.请求返回数据
audio数据为base64码,需要转为wav编码即可听到合成音频
到此服务启动->调用接口->使用数据结束
结束