ChatTTS超强的真人AI语音助手下载使用教程

简介

ChatTTS是专门为对话场景设计的文本转语音模型,支持多人同时对话,适用的场景非常丰富,比如LLM助手对话任务视频配音声音克隆等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练,功能非常的强大。

文本转语音(TTS)在生活中的应用非常的广泛,比如有声小说、语音导航,视频配音和智能家居控制等。

今天给大家推荐一个超强的TTS文本转语音应用,适用于自然、对话式文本转语音,特别适用于大型语言模型助手的对话任务,以及诸如对话式音频和视频配音等,并且可以免费使用。

教程

1. 下载项目源码

点击进入 chatTTS开源项目地址https://github.com/2noise/ChatTTS

解压zip文件,安装python sdk python下载地址

2. 安装项目依赖

cmd控制面板 进入项目根目录,创建python虚拟环境

  • 执行命令,创建一个名为.venv的虚拟环境:
bash 复制代码
python -m venv .venv
  • 执行后会在项目根目录下生成一个.venv文件夹

  • 执行安装项目依赖命令,下载安装项目所需要的环境依赖

bash 复制代码
pip install --upgrade -r requirements.txt
  • 等待下载安装完成

快速启动

确保在执行以下命令时,处于项目根目录下。

启动 WebUI 可视化界面,执行以下命令:

bash 复制代码
python examples/web/webui.py
  • 下次启动只用在项目根目录下执行这个命令即可
  • 首次启动会从https://huggingface.co下载AI语音模型,需要科学上网,过程需要大约20分z左右。

使用教程

启动完成后,会在浏览器里自动打开本地网址。

文生音频

在输入文本框内输入你要生成的语音的文字

选择你想要的音色

点击生成

会在输出音频框内显示生成的音频,点击下载图标,可以下载音频。

声音克隆

在采集音频这个上传一段你想要克隆的人物的声音视频,不要出现其他人物的声音和其他杂音,时长一分钟左右即可。

上传完,在音频代码里面会有你克隆声音的向量代码,复制粘贴,

把复制的人物语音向量代码粘贴到说话人嵌入里面

然后和文生音频的步骤一样,输入你要合成的文字,点击生成按钮即可获得,某个人得克隆音频。

相关文章推荐

《使用 Xinference 部署本地模型》
《Fastgpt接入Whisper本地模型实现语音输入》
《部署和接入使用重排模型bge-reranker》
《部署接入 M3E和chatglm2-m3e文本向量模型》
《Fastgpt 无法启动或启动后无法正常使用的讨论(启动失败、用户未注册等问题这里)》
《vllm推理服务兼容openai服务API》
《解决vllm推理框架内在开启多显卡时报错问题》

相关推荐
zh1570231 天前
JavaScript中WorkerThreads解决服务端计算瓶颈
jvm·数据库·python
马丁聊GEO1 天前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker1 天前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.1 天前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑1 天前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金1 天前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移1 天前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower1 天前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
蜡台1 天前
Python包管理工具pip完全指南-----2
linux·windows·python
Mr.朱鹏1 天前
【Python 进阶 | 第四篇】Psycopg3 + Flask 实现 PostgreSQL CRUD 全流程:从连接池到RESTful接口
python·postgresql·flask·virtualenv·fastapi·pip·tornado