【AI开发:音频】一、GPT-SoVITS整合工具包的部署问题解决(GPU版)

前言

目前GPT-SoVITS的合成效果比较不错,相比较其他厂商的产品要规整的多。众多厂家中也是国内使用最多的一款了,并且这个整合包里携带了,除背景音、切割、训练、微调、合成、低成本合成等一些列完整的工具,也可以作为API进行使用。

++GPT-SoVITS是花儿不哭大佬研发的低成本AI音色克隆软件。++

本文中,使用GPT-SoVITS-beta0306fix2说了下在部署过程中出现的问题,很多问题是几乎搜索不到的,在这里我进行了整理,进行逐一解决。

一、下载

语雀官网:GPT-SoVITS指南 · 语雀

项目地址:GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

二、部署准备

我是在Winwods 10 64专业版部署,所以安装了Miniconda。

1.Miniconda安装

参考:【AI开发:环境篇】Anaconda安装和基础命令-CSDN博客

2.创建虚拟环境(python使用3.9)

复制代码
conda create --name win10 python=3.9

3.设定系统环境

参考:【AI开发:环境篇】Anaconda安装和基础命令-CSDN博客

4.关键点torch

重点:Miniconda是从清华源下载来的,默认的下载源也是清华源,但是清华源下载的torch是CPU版的,那么项目运行起来是找不到GPU的,会出现torch.cuda.is_available() 返回False。所以这里我们要用torch官网的源来进行安装。

题外话:torch.cuda.is_available() 返回False,这个问题不光是因为torch是CPU版本,还有可能是CUDA和torch之间的版本不兼容问题。在这里我们不要轻易去重新安装CUDA,更好的办法是控制torch的版本。

此次安装,我使用的CUDA版本是11.2,所以我再torch官网上下载比11.2高切相近的11.8。

torch官网:PyTorch

复制代码
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

测试下,到这里torch就没问题了!!!

三、GPT-SoVITS部署

1.安装GPT-SoVITS工具包

复制代码
#一下操作可以在虚拟环境中执行,也可以在系统环境中执行,前面我们做了工作的。
#进入项目目录
cd E:\AI Go\GPT-SoVITS-beta0306fix2
#执行安装
pip install -r requirements.txt

2.启动

方法一:命令行

复制代码
python .\webui.py

方法二:BAT

3.启动成功

启动完成后就会自动打开你的默认浏览器,如果没有启动浏览器,可以在浏览器中输入:

http://localhost:9874/

整合包里的其他工具,会占用其他端口,例如9872。。。可以自行摸索了。

下一篇文章里,我将记录它的使用方法。

相关推荐
csdn_aspnet1 小时前
如何用 C# 和 Gemma 3 在本地构建一个真正能完成工作的 AI 代理的
人工智能·ai·c#·gemma
啊哈哈哈哈哈啊哈哈2 小时前
边缘计算与轮廓检测
人工智能·opencv·计算机视觉
cskywit2 小时前
从DFL到无NMS推理:一文拆解YOLO26背后的工程取舍与数学原理
人工智能·机器学习
PPHT-H2 小时前
【人工智能笔记】第四十四节:OpenClaw封神工具 openclaw-free-openai-proxy 免费AI模型批量调用,零token费+稳到不翻车!
人工智能·深度学习·openclaw·免费openai·ai服务代理
yiyu07162 小时前
3分钟搞懂深度学习AI:实操篇:RNN
人工智能·深度学习
uzong2 小时前
CoPaw是什么?-- 2026年开源的国产个人AI助手
人工智能·后端
海盗儿2 小时前
TensorRT-LLM 框架与源码分析
人工智能
无心水2 小时前
【任务调度:框架】11、分布式任务调度进阶:高可用、幂等性、性能优化三板斧
人工智能·分布式·后端·性能优化·架构·2025博客之星·分布式调度框架
码森林3 小时前
小龙虾居然比你更健忘?OpenClaw 记忆系统指南,让它永远记住你
人工智能·ai编程·全栈
ghie90903 小时前
维纳滤波器语音增强MATLAB实现
人工智能·matlab·语音识别