GPT-SoVITS Windows 配置与推理笔记（自用）

这是给自己留的备份，方便下次查。Windows 端配置和推理为主，代码为核心，直接干货。

Git 下载（可选）：

bash 复制代码

git clone https://github.com/RVC-Boss/GPT-SoVITS.git

或者直接去 GPT-SoVITS 项目页，点"Code"按钮，选"Download ZIP"。解压到 D:\GPT-SoVITS（路径自己定）。

进去后双击 go-webui.bat，第一次跑会自动装依赖和下载模型。需要啥提前装好：

Python 3.9：

bash 复制代码

python --version  # 检查是不是 3.9.x

go-webui.bat 一般自动搞定，但要是卡住（比如网络问题），手动敲：

bash 复制代码

python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

PyTorch 按需装：

GPU：

bash 复制代码

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

（CUDA 版本不对就去 PyTorch 官网找对应链接）

CPU：

bash 复制代码

pip install torch torchvision torchaudio

检查：

bash 复制代码

python -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"

双击 go-webui.bat，会弹地址：

复制代码

http://127.0.0.1:9880

浏览器打开。界面分几个Tab，我只用推理：

坑：推理界面，选完模型点"刷新"后，必须勾选 [开启TTS推理WebUI]，不然不会跳到语音合成页面。

权重放好：
- D:\GPT-SoVITS\GPT_weights
- D:\GPT-SoVITS\SoVITS_weights
  下载地址：【碧蓝档案】全学生AI音色模型（自己挑喜欢的角色）。
初始音频：3-10 秒 WAV，上传到 WebUI，音色全靠它。
输入文本："测试一下"之类，选好权重，点生成，底下出音频。
文本太长：用"切分"功能，分段处理，不然容易崩。