MacOS 下运行 GPT-SoVITS

系统环境:

安装 ffmpeg

brew install ffmpeg

查看版本

ffmpeg -version

拉取项目代码

git clone --depth=1 https://github.com/RVC-Boss/GPT-SoVITS

cd GPT-SoVITS

安装好 Miniconda 之后,先创建一个虚拟环境:

conda create -n GPTSoVits python=3.9

conda activate GPTSoVits

安装依赖:

pip3 install -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

(可选)如果网络环境不好,可以考虑换源(比如清华源):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

安装 huggingface-cli 用于和 huggingface hub 交互

pip3 install huggingface_hub

export HF_ENDPOINT=https://hf-mirror.com

下载模型, 由于模型文件较大,可能需要一段时间

--local-dir-use-symlinks False 用于解决 macOS alias 文件的问题

会下载到 GPT_SoVITS/pretrained_models 文件夹下

huggingface-cli download --resume-download lj1995/GPT-SoVITS --local-dir GPT_SoVITS/pretrained_models --local-dir-use-symlinks False

#运行

python webui.py

#运行结果

Matplotlib is building the font cache; this may take a moment.

Downloading g2pw model...

Extracting g2pw model...

Running on local URL: http://0.0.0.0:9874

"/Users/wxl/anaconda3/envs/GPTSoVits/bin/python" tools/uvr5/webui.py "cpu" False 9873 False

操作简要说明:

1)UVR5界面不必须的,主要用于分离歌声与背景声音

2)指定待训练的声音文件路径:如:input/someone

3)依次执行声音拆分、降噪和ASR转写(自动标注)

4)标注界面也不是必须的(手工标注)

5)一键三连提取自监督特征和语义特征(第一步需要下载nltk_data,有可能会失败,要科学上网)

6)依次训练sovits和gpt模型

7)部署模型

8)推理

相关推荐
TGITCIC10 小时前
开源模型登顶?Kimi K2 Thinking 实测解析:它真能超越 GPT-5 吗?
gpt·ai大模型·开源大模型·kimi·月之暗面·大模型ai·国产大模型
金木讲编程2 天前
如何创建“国学助手”GPT?
gpt·ai编程
少林码僧2 天前
2.3 Transformer 变体与扩展:BERT、GPT 与多模态模型
人工智能·gpt·ai·大模型·bert·transformer·1024程序员节
FreeBuf_2 天前
GPT-4o与GPT-5存在七项零点击攻击漏洞
gpt·chatgpt
小小工匠3 天前
Vibe Coding - 免费使用claude code 、gpt-5、grok-code-fast-1进行氛围编程
gpt·claude code·grok-code-fast1
Ztop3 天前
GPT-5.1 已确认!OpenAI下一步推理升级?对决 Gemini 3 在即
人工智能·gpt·chatgpt
L-ololois4 天前
【AI产品】一键比较GPT-5、Claude 4、Gemini 2.5、Deepseek多chatbot
人工智能·gpt
2401_841495644 天前
【自然语言处理】生成式语言模型GPT复现详细技术方案
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
Elastic 中国社区官方博客4 天前
如何使用 Ollama 在本地设置和运行 GPT-OSS
人工智能·gpt·elasticsearch·搜索引擎·ai·语言模型
sztomarch4 天前
Windows11-GPT
gpt