MacOS 下运行 GPT-SoVITS

系统环境:

安装 ffmpeg

brew install ffmpeg

查看版本

ffmpeg -version

拉取项目代码

git clone --depth=1 https://github.com/RVC-Boss/GPT-SoVITS

cd GPT-SoVITS

安装好 Miniconda 之后,先创建一个虚拟环境:

conda create -n GPTSoVits python=3.9

conda activate GPTSoVits

安装依赖:

pip3 install -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

(可选)如果网络环境不好,可以考虑换源(比如清华源):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

pip3 uninstall torch torchaudio

pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu

安装 huggingface-cli 用于和 huggingface hub 交互

pip3 install huggingface_hub

export HF_ENDPOINT=https://hf-mirror.com

下载模型, 由于模型文件较大,可能需要一段时间

--local-dir-use-symlinks False 用于解决 macOS alias 文件的问题

会下载到 GPT_SoVITS/pretrained_models 文件夹下

huggingface-cli download --resume-download lj1995/GPT-SoVITS --local-dir GPT_SoVITS/pretrained_models --local-dir-use-symlinks False

#运行

python webui.py

#运行结果

Matplotlib is building the font cache; this may take a moment.

Downloading g2pw model...

Extracting g2pw model...

Running on local URL: http://0.0.0.0:9874

"/Users/wxl/anaconda3/envs/GPTSoVits/bin/python" tools/uvr5/webui.py "cpu" False 9873 False

操作简要说明:

1)UVR5界面不必须的,主要用于分离歌声与背景声音

2)指定待训练的声音文件路径:如:input/someone

3)依次执行声音拆分、降噪和ASR转写(自动标注)

4)标注界面也不是必须的(手工标注)

5)一键三连提取自监督特征和语义特征(第一步需要下载nltk_data,有可能会失败,要科学上网)

6)依次训练sovits和gpt模型

7)部署模型

8)推理

相关推荐
2402_871321955 小时前
MATLAB方程组
gpt·学习·线性代数·算法·matlab
xwm100010 小时前
【如何用更少的数据作出更好的决策】-gpt生成
gpt
学习前端的小z10 小时前
【AIGC】如何准确引导ChatGPT,实现精细化GPTs指令生成
人工智能·gpt·chatgpt·aigc
菜鸟小码农的博客20 小时前
昇思MindSpore第四课---GPT实现情感分类
gpt·分类·数据挖掘
bingbingyihao1 天前
代码辅助工具 GPT / Cursor
android·java·gpt
hunteritself2 天前
ChatGPT Search VS Kimi探索版:AI搜索哪家强?!
人工智能·gpt·chatgpt·openai·xai
qq_339191143 天前
笔记本run个llm, 本地如何启动大模型,大模型ubuntu 3b llm启动,llm部署 ollama 黑盒run大模型
gpt
新知图书4 天前
PyTorch深度学习与企业级项目实战-预训练语言模型GPT
人工智能·gpt·语言模型
知来者逆5 天前
讨论大语言模型在学术文献应用中的未来与所带来的可能性和担忧
人工智能·gpt·语言模型·自然语言处理·chatgpt·llm·gpt-4v
知来者逆6 天前
探索大规模语言模型(LLM)在心理健康护理领域中的应用与潜力
人工智能·gpt·深度学习·神经网络·自然语言处理·chatgpt·llm