文章目录
-
- [📖 介绍 📖](#📖 介绍 📖)
- [📒 ChatTTS 📒](#📒 ChatTTS 📒)
-
- [📝 项目介绍](#📝 项目介绍)
- [📝 项目亮点](#📝 项目亮点)
- [📝 UI](#📝 UI)
- [🎈 项目地址 🎈](#🎈 项目地址 🎈)
📖 介绍 📖
在AI技术迅速发展的今天,文本到语音(Text-to-Speech,简称TTS)的转换已经成为许多场景下的必备技能,例如语音助手、客服机器人、导航系统等。今天,和大家分享一个在Gitcode平台上热门的TTS项目------ChatTTS。
📒 ChatTTS 📒
ChatTTS项目是一个开源的文字转语音项目,旨在为开发者提供简单易用的语音合成解决方案。该项目基于多种语音合成技术,实现了高质量的语音输出效果。
📝 项目介绍
ChatTTS项目通过调研和选用现有的语音合成技术,提供了一个功能强大的文字转语音工具。项目地址:ChatTTS。
📝 项目亮点
- 对话式 TTS:ChatTTS 针对基于对话的任务进行了优化,可实现自然和富有表现力的语音合成。它支持多个扬声器,促进交互式对话。
- 细粒度控制:该模型可以预测和控制细粒度的韵律特征,包括笑声、停顿和感叹词。
- 更好的韵律:ChatTTS 在韵律方面超过了大多数开源 TTS 模型。我们提供预训练模型来支持进一步的研究和开发。
📝 UI
- 建议配合另外一个图形界面项目 ChatTTS-ui项目地址 来使用。ChatTTS webUI 是一个简单的本地网页界面,在网页使用 ChatTTS 将文字合成为语音,支持中英文、数字混杂,并提供API接口。
原始[ChatTTS](https://github.com/2noise/chattts)项目
界面预览
-
试听合成语音效果
https://github.com/jianchang512/ChatTTS-ui/assets/3378335/bd6aaef9-a49a-4a81-803a-91e3320bf808 -
文字数字符号 控制符混杂效果
https://github.com/jianchang512/ChatTTS-ui/assets/3378335/e2a08ea0-32af-4a30-8880-3a91f6cbea55
Windows预打包版
- 从 Releases 中下载压缩包,解压后双击 app.exe 即可使用
- 某些安全软件可能报毒,请退出或使用源码部署
- 英伟达显卡大于4G显存,并安装了CUDA11.8+后,将启用GPU加速
Linux 下容器部署安装
-
拉取项目仓库
在任意路径下克隆项目,例如:bashgit clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui
-
启动 Runner
进入到项目目录:
bash cd chat-tts-ui
启动容器并查看初始化日志:bashgpu版本 docker compose -f docker-compose.gpu.yaml up -d cpu版本 docker compose -f docker-compose.cpu.yaml up -d docker compose logs -f --no-log-prefix
-
访问 ChatTTS WebUI
启动:['0.0.0.0', '9966']
,访问部署设备的IP:9966
即可,例如:- 本机:
http://127.0.0.1:9966
- 服务器:
http://192.168.1.100:9966
- 本机: