qwen3-tts 文字转语音 懒人整合包

Qwen3-TTS

github地址:github.com/QwenLM/Qwen...

Qwen3-TTS是通义千问团队开发的开源语音合成模型系列,支持多音色、多语种与多方言的语音生成

懒人包界面

注意,建议显存8GB以上

使用方式

下载并解压懒人包,点击一键启动WebUi.bat

等待终端执行

执行成功后会自动打开网页

网页为https,因为证书问题,需要点击高级,运行,才能正常访问界面

本文只演示声音设计

比如声音描述为甜美的萝莉音或者可爱的小孩音,都行,声音会按描述的内容生成

生成后可以点击试听或者下载

目前语音克隆和自定义音色请自行测试

Tips

点击此处 网盘下载

可以由stable difftion webui生成人像图片

然后Qwen3-TTS生成要说的语音内容

soulX-FlashHead把图片和语音生成数字人视频

相关推荐
DisonTangor39 分钟前
微软重磅开源 Lens: 重新思考基础文本到图像模型的训练效率
人工智能·microsoft·ai作画·开源·aigc
FelixBitSoul44 分钟前
面试必考!RAG 知识库全链路深度解析:父子分块 × Rerank × 查询重写 × 标准化改写
人工智能·langchain·aigc
悟空码字1 小时前
当 AI 遇到真正的编程痛点,Codex 攻克 5 类核心难题总结
aigc·openai·ai编程
小小神仙1 小时前
ECC:怎么让 Claude Code 变成你的全栈搭档
程序员·aigc·ai编程
恋猫de小郭2 小时前
能在手机本地跑的图像生成模型 Bonsai Image ,效果还不错
前端·aigc·ai编程
Rocky Ding*3 小时前
深入浅出完整解析AIGC时代中GAN(Generative Adversarial Network)系列模型核心基础知识(下篇)
论文阅读·人工智能·深度学习·机器学习·aigc·gan·ai-native
星纬智联技术3 小时前
AI搜索引擎引用逻辑正在重构:企业内容策略的信任信号构建与监控方法论
人工智能·aigc·geo
手写码匠3 小时前
华为云Flexus+DeepSeek征文|万字实战:MaaS 推理服务 + Dify 高可用部署 + AI Agent 开发全流程
人工智能·深度学习·算法·aigc
不爱洗脚的小滕12 小时前
【RAG】召回(Retrieval)与重排(Rerank)核心技术要点汇总
langchain·aigc·ai编程·rag
win4r13 小时前
MiniMax M3 深度体验:这可能是国产模型里最接近“全能工程师”的一次
aigc·ai编程·claude