qwen3-tts 文字转语音懒人整合包

evan20202026-04-01 21:49

Qwen3-TTS

github地址：github.com/QwenLM/Qwen...

Qwen3-TTS是通义千问团队开发的开源语音合成模型系列，支持多音色、多语种与多方言的语音生成

懒人包界面

注意，建议显存8GB以上

使用方式

下载并解压懒人包，点击一键启动WebUi.bat

等待终端执行

执行成功后会自动打开网页

网页为https，因为证书问题，需要点击高级，运行，才能正常访问界面

本文只演示声音设计

比如声音描述为甜美的萝莉音或者可爱的小孩音，都行，声音会按描述的内容生成

生成后可以点击试听或者下载

目前语音克隆和自定义音色请自行测试

Tips

点击此处网盘下载

可以由stable difftion webui生成人像图片

然后Qwen3-TTS生成要说的语音内容

再soulX-FlashHead把图片和语音生成数字人视频

上一篇：paddleOcr 懒人整合包添加pdf和图片转markdown 添加GPU支持

下一篇：商家为什么开始用小程序替代传统网站？

热门推荐

01GitHub 镜像站点 02幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 03AI科技热点日报 | 2026年07月01日 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08全面体验 Grok API 中转站（2025 · Grok 4 系列最新版）092026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 10几个好用的ip纯净度检测网站