mac部署GPT-SoVITS,生成粤语踩坑点及使用记录

自己录音,普通话或者粤语

注意:

与在其他设备上训练的模型相比,在mac上使用gpu训练的模型的质量明显较低,因此我们暂时使用cpu代替。

  1. Install Xcode command-line tools by running xcode-select --install.
  2. Install FFmpeg by running brew install ffmpeg.
  3. Install the program by running the following commands:
复制代码
conda create -n GPTSoVits python=3.9
conda activate GPTSoVits
pip install -r requirements.txt

GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

注意py的版本

激活环境:

复制代码
conda activate GPTSoVits 

在macos上训练自己的声音

激活环境:

复制代码
conda activate GPTSoVits 

第一踩坑点

启动命令:

复制代码
python3 webui.py

之后,无法跳转,显示超时

复制代码
File "/opt/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/pydantic/_internal/_generate_schema.py", line 558, in _unknown_type_schema
    raise PydanticSchemaGenerationError(
pydantic.errors.PydanticSchemaGenerationError

解决方法:

复制代码
pip uninstall fastapi
pip install fastapi==0.112.2

成功跑起:

第二个踩坑点

是在微调训练gpt报错

复制代码
RuntimeError: Index tensor must have the same number of dimensions as self tensor
复制代码
return torch.zeros_like(preds_oh, dtype=torch.int32).scatter_(-1, result.unsqueeze(1).unsqueeze(1), 1)
RuntimeError: Index tensor must have the same number of dimensions as self tensor
​

解决方法:

复制代码
pip install torchmetrics==1.5

最后成功跑起

效果:

CondaError: Run 'conda init' before 'conda activate'

利用Mobaxterm连接远程服务器,在创建conda环境后报错。

输入conda init后返回No action taken.

解决方法

  1. 输入source activate,后发现前面多了(base)

  2. 输入conda activate xxx(此处为自定义的环境名称),后发现(base)变为(xxx)

参考:https://zhuanlan.zhihu.com/p/683118485

使用教程记录

语音切割,降噪,进行选择语音,就可以打标了

打标界面

之后可以进行训练了

微调模型

终端

相关推荐
元Y亨H19 小时前
MacBook Air 开发神器:IDEA 与 PyCharm 极简安装及环境配置
macos
yuanyxh2 天前
macOS 应用 - 纯对话生成
前端·macos·ai编程
newbe365242 天前
对接 Reasonix 1.x 跑通 DeepSeek V4:ACP 模型选择器接入实战
gpt·claude·chatglm (智谱)
newbe365243 天前
如何使用 Upptime 免费搭建自己的状态站点
gpt·claude·chatglm (智谱)
AI创界者3 天前
PilotTTS 一键整合包(Win/Mac):8G 显存畅跑,实测解锁情绪与副语言的精准控制
人工智能·macos·aigc·音视频
闪闪发亮的小星星3 天前
高斯光以及高斯光公式解释
笔记
gis分享者3 天前
GPT-Image-2 图像生成模型新手实战指南
gpt·ai·image·模型·图像生成
cqbzcsq3 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波4 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm