MacOS 下运行 GPT-SoVITS

系统环境:

安装 ffmpeg

brew install ffmpeg

查看版本

ffmpeg -version

拉取项目代码

git clone --depth=1 https://github.com/RVC-Boss/GPT-SoVITS

cd GPT-SoVITS

安装好 Miniconda 之后,先创建一个虚拟环境:

conda create -n GPTSoVits python=3.9

conda activate GPTSoVits

安装依赖:

pip3 install -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

(可选)如果网络环境不好,可以考虑换源(比如清华源):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

安装 huggingface-cli 用于和 huggingface hub 交互

pip3 install huggingface_hub

export HF_ENDPOINT=https://hf-mirror.com

下载模型, 由于模型文件较大,可能需要一段时间

--local-dir-use-symlinks False 用于解决 macOS alias 文件的问题

会下载到 GPT_SoVITS/pretrained_models 文件夹下

huggingface-cli download --resume-download lj1995/GPT-SoVITS --local-dir GPT_SoVITS/pretrained_models --local-dir-use-symlinks False

#运行

python webui.py

#运行结果

Matplotlib is building the font cache; this may take a moment.

Downloading g2pw model...

Extracting g2pw model...

Running on local URL: http://0.0.0.0:9874

"/Users/wxl/anaconda3/envs/GPTSoVits/bin/python" tools/uvr5/webui.py "cpu" False 9873 False

操作简要说明:

1)UVR5界面不必须的,主要用于分离歌声与背景声音

2)指定待训练的声音文件路径:如:input/someone

3)依次执行声音拆分、降噪和ASR转写(自动标注)

4)标注界面也不是必须的(手工标注)

5)一键三连提取自监督特征和语义特征(第一步需要下载nltk_data,有可能会失败,要科学上网)

6)依次训练sovits和gpt模型

7)部署模型

8)推理

相关推荐
蹦蹦跳跳真可爱58919 小时前
Python----大模型(GPT-2模型训练,预测)
开发语言·人工智能·pytorch·python·gpt·深度学习·embedding
村口曹大爷1 天前
【深度】OpenAI 推理架构演进:GPT-5.2(Internal版)性能实测与开发者接入路径分析
gpt·ai·chatgpt·架构·gpt5.2
百***78751 天前
GPT-5.2 快速接入指南(3步极简落地)
gpt
伟大的大威2 天前
实战:在 NVIDIA Blackwell GB10 上部署 GPT-OSS 120B (MXFP4) 全流程避坑指南
gpt
百***78752 天前
极简接入流程(3 步直连 GPT-5.2)
gpt
程序员佳佳2 天前
【硬核实测】GPT-5.2-Pro 对决 Gemini-3-Pro (Banana Pro):开发者如何低成本接入下一代 AI 模型?附 Python 源码
人工智能·python·gpt·chatgpt·ai作画·midjourney·ai编程
沛沛老爹2 天前
Web开发者实战AI Agent:基于Dify实现OpenAI Deep Research智能体
前端·人工智能·gpt·agent·rag·web转型
程序员佳佳3 天前
文章标题:彻底抛弃OpenAI官方Key?实测GPT-5.2与Banana Pro(Gemini 3):这才是开发者的终极红利!
开发语言·人工智能·python·gpt·ai作画·api·midjourney
程序员佳佳4 天前
GPT-4时代终结?GPT-5.2与Banana Pro实测数据公开,普通开发者如何接住这泼天富贵
开发语言·python·gpt·chatgpt·重构·api·midjourney
hunteritself4 天前
Adobe 把 Photoshop 搬进了 ChatGPT,免费的
gpt·机器学习·ui·adobe·chatgpt·智能手机·photoshop