Mangio RVC Fork 本地部署(Cuda12.9)

在 Windows 11 上尝试部署 Mangio RVC Fork,目标是实现本地语音转换。过程中踩了不少坑,特别是 PyTorch、Fairseq 和依赖安装顺序。这里整理完整流程。


1. 环境准备

  • 操作系统:Windows 11

  • Python:3.10(3.11以上有兼容性问题,务必使用3.10)

  • CUDA:12.9

  • GPU:RTX5060 8G

  • 开发工具:Vs Code


2. Python 虚拟环境

复制代码
python -m venv rvc_env
rvc_env\Scripts\activate
pip install --upgrade pip
  • 虚拟环境可以避免依赖冲突

  • 激活后所有操作都在这个环境下进行


3. PyTorch 安装(CUDA 12.9)

关键点:requirements.txt中的PyTorch是cpu版

复制代码
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
  • 说明:

    • --pre 表示 night build

    • 对应 CUDA 12.9(cu128)


4. Fairseq 安装

  • Windows 报错多,需要C++构建

  • 直接手动下载安装 whl 文件:

    pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl

  • 安全序列化问题,是PyTorch版本问题:

python 复制代码
import torch
import fairseq.data.dictionary  # 必须先导入
torch.serialization.add_safe_globals([fairseq.data.dictionary.Dictionary])
  • 这一步必须加在 infer_web.py ,否则加载 RVC 模型会报错。

5. requirements.txt 安装注意事项

  • 不要直接安装整个 requirements.txt,torch 和 fairseq会有问题

  • 正确做法:

    先安装 PyTorch + CUDA 12.8

    pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

    先安装 Fairseq whl

    pip install fairseq-0.12.2-cp310-cp310-win_amd64.whl

    再安装 requirements.txt,但删除 torch/fairseq 相关行

    pip install -r requirements.txt


6. 模型权重

  • RVC 需要转换的音色模型,放在 weights/ 目录:
python 复制代码
weights/
├─ A.pth
├─ B.pth
  • 输入音频目录:audios/

  • 输出音频目录:opt

  • RMVPE 模型(rmvpe.pt

    • 提取音频特征

    • 必须放在项目根路径下,否则 RVC 无法运行

  • Hubert Base 模型(hubert_base.pt

    • 音频特征提取的基础模型

    • 同样必须放在项目根路径下


7. FFmpeg 安装

  • Windows 版 FFmpeg 下载并解压,加入系统 PATH

  • 测试命令:

    ffmpeg -version


8. Web Infer 启动

  • 运行:

    python infer_web.py

  • 浏览器访问本地端口即可操作


9. 遇到的坑总结

解决方案
CUDA 12.8 + PyTorch 先安装 night build GPU 版本,再装 requirements.txt
CPU torch 覆盖 GPU 删除 requirements.txt 中 torch/fairseq,避免降级
Fairseq Windows 安装 手动下载 whl 安装
安全序列化报错 infer_web.py 加 add_safe_globals([Dictionary])
权重缺失 rmvpe.pth、hubert_base.pt、RVC 模型都放 weights/
FFmpeg 下载 Windows 版并加入 PATH