qwen3-tts 文字转语音 懒人整合包

Qwen3-TTS

github地址:github.com/QwenLM/Qwen...

Qwen3-TTS是通义千问团队开发的开源语音合成模型系列,支持多音色、多语种与多方言的语音生成

懒人包界面

注意,建议显存8GB以上

使用方式

下载并解压懒人包,点击一键启动WebUi.bat

等待终端执行

执行成功后会自动打开网页

网页为https,因为证书问题,需要点击高级,运行,才能正常访问界面

本文只演示声音设计

比如声音描述为甜美的萝莉音或者可爱的小孩音,都行,声音会按描述的内容生成

生成后可以点击试听或者下载

目前语音克隆和自定义音色请自行测试

Tips

点击此处 网盘下载

可以由stable difftion webui生成人像图片

然后Qwen3-TTS生成要说的语音内容

soulX-FlashHead把图片和语音生成数字人视频

相关推荐
ServBay7 小时前
如何利用本地技术栈构建 0 成本 AI SaaS 雏形
后端·aigc·ai编程
RainmeoX9 小时前
Gemma 4 情绪分类微调实录:AMD ROCm 单卡 + LoRA 全流程
aigc
leeyi11 小时前
Deer-Go:字节 Deer-Flow 的 Go 移植,深度研究 Agent 全拆解
go·aigc·agent
threerocks14 小时前
AI编程的商业模式已经在互联网大厂跑通了
程序员·aigc·ai编程
怕浪猫16 小时前
第3章 记忆系统:构建Agent的长期与短期记忆
aigc·openai·ai编程
DigitalOcean1 天前
AI 推理采用本地 + Serverless 混合架构:让敏感数据不出户,算力成本更低
aigc·agent
leeyi1 天前
Manus Agent:一个全能 AI,和一支研究团队
后端·aigc·agent
刘棕霆1 天前
18—sentry-static 入口收敛:从多能力检查到 1 个静态分析入口
aigc·测试
To_OC2 天前
别再跟 AI 死磕 prompt 了,我写了个 Loop 让它自己改到满意为止
人工智能·aigc·agent