melo tts安装使用

https://github.com/myshell-ai/MeloTTS?tab=readme-ov-file

git clone https://github.com/myshell-ai/MeloTTS.git

cd MeloTTS

pip install -e .

python -m unidic download

复制代码
from melo.api import TTS

# Speed is adjustable
speed = 1.0
device = 'cpu' # or cuda:0

text = "我最近在学习machine learning,希望能够在未来的artificial intelligence领域有所建树。"
model = TTS(language='ZH', device=device)
speaker_ids = model.hps.data.spk2id

output_path = 'zh.wav'
model.tts_to_file(text, speaker_ids['ZH'], output_path, speed=speed)

他会自己下载模型 他有本地设置参数 但是我设置了 他也还需要其他的一些模型

复制代码
#coding=utf-8 
from melo.api import TTS

# Speed is adjustable
speed = 1.0
device = 'cpu' # or cuda:0

text = "更绝的是,当萧希希问起董事长女儿时,张浩竟然说那姑娘追了他四十五年,自己没答应,因为人长得太磕碜!这话让萧希希彻底怒了,她决定好好陪这个傻小子玩玩。可张浩还不知道,他骂得最狠的那个"丑姑娘",此刻就坐在他对面!这场身份悬殊的相遇,到底会擦出怎样的火花?张浩能发现眼前这个"麦当娜"的真实身份吗?"
model = TTS(language='ZH', device=device)
speaker_ids = model.hps.data.spk2id

output_path = 'zh.wav'
model.tts_to_file(text, speaker_ids['ZH'], output_path)
import soundfile as sf

au,sr = sf.read(output_path)

au = au * 1.5

sf.write('123.wav',au,sr)

会报错

安装完整版

pip install unidic

下载词典(这一步需要联网,可能会慢)

python -m unidic download

必须开着代理才能用

所以

我的解决办法是 设置离线变量 并且在模型的时候需要配置path

我这里直接连接的软链接 huggingface-cli下载可以禁止软链接

复制代码
model = TTS(language='ZH', device=device,use_hf=False,ckpt_path=r'C:\Users\Administrator\.cache\huggingface\hub\models--myshell-ai--MeloTTS-Chinese\snapshots\af5d207a364ea4208c6f589c89f57f88414bdd16\checkpoint.pth',config_path=r'C:\Users\Administrator\.cache\huggingface\hub\models--myshell-ai--MeloTTS-Chinese\snapshots\af5d207a364ea4208c6f589c89f57f88414bdd16\config.json')

#coding=utf-8 
import os

# 设置所有已知的离线相关环境变量
os.environ['HF_HUB_OFFLINE'] = '1'
# os.environ['TRANSFORMERS_OFFLINE'] = '1'
# os.environ['HF_DATASETS_OFFLINE'] = '1'
# 如果你之前设置了 HF_ENDPOINT,可以保留,但离线模式开启后它应该不会生效
# os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
from melo.api import TTS

解决办法

大模型日常:支持中英混合及多语言文生语音的MeloTTS本地部署-CSDN博客

出现这个问题 就去删除掉重新下 或者执行这两个命令看看是不是提示已经下载好了的

主要问题就是没下载这个模型

你或者直接运行这个命令下载这个模型

复制代码
from melo.api import TTS
 
# Speed is adjustable
speed = 1.0
device = 'cpu' # or cuda:0
 
text = "我最近在学习machine learning,希望能够在未来的artificial intelligence领域有所建树。"
model = TTS(language='ZH', device=device)
speaker_ids = model.hps.data.spk2id
 
output_path = 'zh.wav'
model.tts_to_file(text, speaker_ids['ZH'], output_path, speed=speed)

有时候这上面也还有一个目录 hub下面的删除掉

相关推荐
qq_3926906615 小时前
如何处理MongoDB分片集群的连接池耗尽危机_客户端连接与mongos到shard的连接乘数效应
jvm·数据库·python
qq_3721542315 小时前
Python异步爬虫如何应对封IP_结合asyncio与代理池实现轮询请求
jvm·数据库·python
abc123456sdggfd15 小时前
php怎么处理跨域请求_php如何设置header解决跨域问题详解
jvm·数据库·python
伊玛目的门徒15 小时前
多线程韩漫爬虫下载器
爬虫·python·漫画·韩漫
zhangchaoxies15 小时前
如何在CSS中正确加载本地JPG背景图片
jvm·数据库·python
Hello未来15 小时前
llamafactory 的使用和安装
python·深度学习·语言模型·自然语言处理·nlp
z44247532615 小时前
CSS如何实现元素悬浮在页面底部_利用fixed定位与底部间距
jvm·数据库·python
m0_5964063715 小时前
mysql数据库用户密码加固策略_实施强密码策略与定期轮换
jvm·数据库·python
m0_6765443815 小时前
CSS如何实现语义化样式编写_使用BEM规范提升命名直观性
jvm·数据库·python
KivenMitnick15 小时前
CialloVOL 1.2:便捷好用的轻量化内存取证分析平台
windows·python·安全·网络安全·flask·系统安全·安全威胁分析