MacOS 下运行 GPT-SoVITS

系统环境:

安装 ffmpeg

brew install ffmpeg

查看版本

ffmpeg -version

拉取项目代码

git clone --depth=1 https://github.com/RVC-Boss/GPT-SoVITS

cd GPT-SoVITS

安装好 Miniconda 之后,先创建一个虚拟环境:

conda create -n GPTSoVits python=3.9

conda activate GPTSoVits

安装依赖:

pip3 install -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

(可选)如果网络环境不好,可以考虑换源(比如清华源):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

安装 huggingface-cli 用于和 huggingface hub 交互

pip3 install huggingface_hub

export HF_ENDPOINT=https://hf-mirror.com

下载模型, 由于模型文件较大,可能需要一段时间

--local-dir-use-symlinks False 用于解决 macOS alias 文件的问题

会下载到 GPT_SoVITS/pretrained_models 文件夹下

huggingface-cli download --resume-download lj1995/GPT-SoVITS --local-dir GPT_SoVITS/pretrained_models --local-dir-use-symlinks False

#运行

python webui.py

#运行结果

Matplotlib is building the font cache; this may take a moment.

Downloading g2pw model...

Extracting g2pw model...

Running on local URL: http://0.0.0.0:9874

"/Users/wxl/anaconda3/envs/GPTSoVits/bin/python" tools/uvr5/webui.py "cpu" False 9873 False

操作简要说明:

1)UVR5界面不必须的,主要用于分离歌声与背景声音

2)指定待训练的声音文件路径:如:input/someone

3)依次执行声音拆分、降噪和ASR转写(自动标注)

4)标注界面也不是必须的(手工标注)

5)一键三连提取自监督特征和语义特征(第一步需要下载nltk_data,有可能会失败,要科学上网)

6)依次训练sovits和gpt模型

7)部署模型

8)推理

相关推荐
川川菜鸟9 小时前
用一句完整提示词,直接做出一个“球球大作战”级小游戏
gpt·gemini
Pocker_Spades_A13 小时前
AiOnly平台大模型API实战:一键调用GPT-5搭建个人专属文本摘要工具
gpt
Sherlock Ma1 天前
OpenAI新论文!GPT-5-Thinking新训练方法
人工智能·gpt·深度学习·语言模型·自然语言处理·chatgpt·openai
热爱生活的五柒2 天前
gpt上面的内容复制到word后格式会乱怎么办?
gpt
qq19226382 天前
分布式光伏发电系统并网运行的Matlab仿真研究
gpt
Niuguangshuo2 天前
从 One-Hot 到 GPT:语言模型的演进之路
人工智能·gpt·语言模型
询问QQ:180809512 天前
复现ICRA 2022自动驾驶实时轨迹规划:速度路径解耦方法研究,基于Linux系统ROS的场...
gpt
桂花饼2 天前
GPT-5.1-Codex-Max 架构深度解析:原生“压缩”机制如何重塑智能体编程?
gpt·aigc·ai编程·大模型实战·gemini 3 pro·claude opus 4.5·gpt-5.1max
桂花饼3 天前
GPT-5.1-Codex-Max:原生“记忆压缩”重塑编程范式,让 AI 连续写代码 24 小时不再是梦
人工智能·gpt·ai绘图·nano banana 2·图像生成api·openai兼容接口·gpt-5.1-codex
陈 洪 伟4 天前
Transformer彻底剖析(1):GPT中的Transformer架构
gpt·深度学习·transformer