qwen3-tts 文字转语音 懒人整合包

Qwen3-TTS

github地址:github.com/QwenLM/Qwen...

Qwen3-TTS是通义千问团队开发的开源语音合成模型系列,支持多音色、多语种与多方言的语音生成

懒人包界面

注意,建议显存8GB以上

使用方式

下载并解压懒人包,点击一键启动WebUi.bat

等待终端执行

执行成功后会自动打开网页

网页为https,因为证书问题,需要点击高级,运行,才能正常访问界面

本文只演示声音设计

比如声音描述为甜美的萝莉音或者可爱的小孩音,都行,声音会按描述的内容生成

生成后可以点击试听或者下载

目前语音克隆和自定义音色请自行测试

Tips

点击此处 网盘下载

可以由stable difftion webui生成人像图片

然后Qwen3-TTS生成要说的语音内容

soulX-FlashHead把图片和语音生成数字人视频

相关推荐
evan20202 小时前
paddleOcr 懒人整合包 添加pdf和图片转markdown 添加GPU支持
aigc
evan20202 小时前
Wan2.2-Animate动作迁移 图片同步视频姿态 懒人整合包
aigc
evan20202 小时前
IOPaint 开源ai去水印 去除背景 懒人整合包
aigc
evan20202 小时前
LatentSync 开源数字人视频对口型 懒人整合包
aigc
evan20202 小时前
SoulX-FlashHead 实时图片数字人生成器 8GB显存可用 一键懒人整合包下载
aigc
evan20202 小时前
开源免费人像抠图神器!CPU也能跑的RMBG去背景(懒人一键搞定版)
aigc
evan20202 小时前
PaddleOCR-VL-1.5 懒人整合包 支持PDF转MD 比PP-StructureV3更精准
aigc
evan20202 小时前
Qwen_ImageEdit_2511 图片多角度 分镜 懒人整合包
aigc
evan20202 小时前
MatAnyone2 视频去除背景 懒人整合包
aigc