GPT-SoVITS开源音色克隆框架的训练与调试

GPT-SoVITS开源框架的报错与调试

GPT-SoVITS是一款创新的跨语言音色克隆工具,同时也是一个非常棒的少样本中文声音克隆项目。

它是是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音,作者已测试,部署很方便,训练速度很快,效果很好。项目发布不到1个月就有了9.3k star。

遇到的问题

GPT-SoVITS的项目地址为链接: GPT-SoVITS。我在本地部署后,即可打开可视化网页,并在网页上更改参数和进行模型训练。

打开的网页如下所示:

在微调训练中,依次点击开启SoVITS训练和GPT训练后,两个训练进程输出信息为训练已完成。但是在模型的推理页面中,点击刷新路径后,找不到刚刚训练的模型权重。

解决办法

将微调训练中的batch_size改小一点,这里我改为了10,使得程序能够跑起来。

不知为何,显存不足的情况,权重未跑出,但是也没有报错信息。

原因就是查看服务器的显存占用,发现利用率已经快满了。

改过之后,就能够看到模型的权重信息了。

相关推荐
InfiSight智睿视界几秒前
当老字号遇上AI:阳坊涮肉的数字化运营转型之路
大数据·人工智能·连锁店智能巡检
张3蜂2 分钟前
OpenClaw 深度解析:从个人 AI 助理到开源智能体平台
人工智能·开源
程序员欣宸3 分钟前
LangChain4j实战之十六:RAG (检索增强生成),Naive RAG
java·人工智能·ai·langchain4j
Dingdangcat863 分钟前
轮胎缺陷检测与分类系统基于solov2_r101_fpn_ms-3x_coco模型实现_fulltyre专项识别_1
人工智能·分类·数据挖掘
Ivanqhz4 分钟前
现代异构高性能计算(HPC)集群节点架构
开发语言·人工智能·后端·算法·架构·云计算·边缘计算
weixin_509138344 分钟前
探索智能体认知动力学:几何视角下的AI革命(系列博客第二期)
人工智能·机器学习·语义空间
Loo国昌6 分钟前
【大模型应用开发】第三阶段:深度解析检索增强生成(RAG)原理
人工智能·后端·深度学习·自然语言处理·transformer
ONLYOFFICE6 分钟前
ONLYOFFICE AI 插件新功能:轻松创建专属 AI 助手
人工智能·onlyoffice
audyxiao0016 分钟前
AI一周重要会议和活动概览(2.2-2.8)
人工智能·大模型·iclr·ccf·一周会议与活动
柠萌f7 分钟前
2026 素材趋势报告:为什么“素材工程能力”,正在决定品牌的投放天花板?
人工智能