【AI开发:音频】一、GPT-SoVITS整合工具包的部署问题解决(GPU版)

前言

目前GPT-SoVITS的合成效果比较不错,相比较其他厂商的产品要规整的多。众多厂家中也是国内使用最多的一款了,并且这个整合包里携带了,除背景音、切割、训练、微调、合成、低成本合成等一些列完整的工具,也可以作为API进行使用。

++GPT-SoVITS是花儿不哭大佬研发的低成本AI音色克隆软件。++

本文中,使用GPT-SoVITS-beta0306fix2说了下在部署过程中出现的问题,很多问题是几乎搜索不到的,在这里我进行了整理,进行逐一解决。

一、下载

语雀官网:GPT-SoVITS指南 · 语雀

项目地址:GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

二、部署准备

我是在Winwods 10 64专业版部署,所以安装了Miniconda。

1.Miniconda安装

参考:【AI开发:环境篇】Anaconda安装和基础命令-CSDN博客

2.创建虚拟环境(python使用3.9)

复制代码
conda create --name win10 python=3.9

3.设定系统环境

参考:【AI开发:环境篇】Anaconda安装和基础命令-CSDN博客

4.关键点torch

重点:Miniconda是从清华源下载来的,默认的下载源也是清华源,但是清华源下载的torch是CPU版的,那么项目运行起来是找不到GPU的,会出现torch.cuda.is_available() 返回False。所以这里我们要用torch官网的源来进行安装。

题外话:torch.cuda.is_available() 返回False,这个问题不光是因为torch是CPU版本,还有可能是CUDA和torch之间的版本不兼容问题。在这里我们不要轻易去重新安装CUDA,更好的办法是控制torch的版本。

此次安装,我使用的CUDA版本是11.2,所以我再torch官网上下载比11.2高切相近的11.8。

torch官网:PyTorch

复制代码
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

测试下,到这里torch就没问题了!!!

三、GPT-SoVITS部署

1.安装GPT-SoVITS工具包

复制代码
#一下操作可以在虚拟环境中执行,也可以在系统环境中执行,前面我们做了工作的。
#进入项目目录
cd E:\AI Go\GPT-SoVITS-beta0306fix2
#执行安装
pip install -r requirements.txt

2.启动

方法一:命令行

复制代码
python .\webui.py

方法二:BAT

3.启动成功

启动完成后就会自动打开你的默认浏览器,如果没有启动浏览器,可以在浏览器中输入:

http://localhost:9874/

整合包里的其他工具,会占用其他端口,例如9872。。。可以自行摸索了。

下一篇文章里,我将记录它的使用方法。

相关推荐
DN20201 分钟前
AI销售机器人:节日祝福转化率提升30倍
人工智能·python·深度学习·机器学习·机器人·节日
香芋Yu5 分钟前
【大模型教程——第二部分:Transformer架构揭秘】第2章:模型家族谱系:从编码器到解码器 (Model Architectures)
深度学习·架构·transformer
爱喝可乐的老王18 分钟前
PyTorch简介与安装
人工智能·pytorch·python
deephub23 分钟前
用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入
人工智能·pytorch·python·深度学习·大语言模型
量子-Alex28 分钟前
【多模态大模型】Qwen2-VL项目代码初步解析
人工智能
飞鹰5136 分钟前
深度学习算子CUDA优化实战:从GEMM到Transformer—Week4学习总结
c++·人工智能·深度学习·学习·transformer
工程师老罗38 分钟前
Pytorch如何验证模型?
人工智能·pytorch·深度学习
Hi_kenyon39 分钟前
Skills精选
人工智能
沈浩(种子思维作者)1 小时前
铁的居里点(770度就不被磁铁吸了)道理是什么?能不能精确计算出来?
人工智能·python·flask·量子计算
沛沛老爹1 小时前
Web开发者转型AI:多模态Agent视频分析技能开发实战
前端·人工智能·音视频