【AI语音】edge-tts实现文本转语音,免费且音质不错

目标

前边可以翻译大藏经了,拿到翻译文件就想转语音了。这次不要阿里的api的,免费额度少,不免费就有点贵,公益项目用公益资源喽。

结论:

我github访问不了,tts装不上,espeak, MaryTTS,festival,都尝试失败,pyttsx3成功了,但效果真看不上,然后就来到了gitcode.com,搜了一下tts,然后部署了edge-tts,误打误撞还是可以用。

准备:

准备环境,用目前知道的最可心的trae,安装部署参考上一篇文档:

【Ai工具】trae和传统编程环境vs+代码助手的PK,结果大捷-CSDN博客

安装部署

有两种方式:

方式一、可以在Trae中,直接问AI,根据反馈操作:

方式二、参考gitcode文档安装:

地址:GitCode - 全球开发者的开源社区,开源代码托管平台

安装命令:

复制代码
pip install edge-tts

安装成功:

命令行使用:

复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

把文本转成语音hello.mp3,还带字幕hello.srt,乖乖音质不错,字幕更不错:

查一下有哪些声音可用:

复制代码
edge-tts --list-voices

那是非常多,没截全:

重点中文声音是够用的:

代码调用

然后代码实现调用,可以从示例里直接拷贝代码,

当然,也可以让AI帮你写,大家可以参考下面代码,是验证通过的:

复制代码
import asyncio
from edge_tts import Communicate

async def main():
    text = "你好,欢迎使用 Microsoft Edge TTS 服务!"
    voice = "zh-CN-XiaoyiNeural"  # 中文语音,可替换为其他支持的语言和声音

    communicate = Communicate(text, voice)
    await communicate.save("haha.mp3")

# 运行异步任务
asyncio.run(main())

把所有声音输出了一下,总结了一下各声音特点,供大家参考:

|------------------------------|--------|----------|----------|-----------------------|
| 模型名称 | 性别 | 适用场景 | 音色特点 | 备注 |
| zh-CN-XiaoxiaoNeural | 女 | 新闻、有声书 | 温暖 | 柔声,温柔的小女生 |
| zh-CN-XiaoyiNeural | 女 | 动漫、有声书 | 活泼 | 认真说话的小女孩 |
| zh-CN-YunjianNeural | 男 | 体育、有声书 | 激情 | 浑厚,坚定值得信任的中层干部 |
| zh-CN-YunxiNeural | 男 | 有声书 | 活泼、阳光 | 最流行的解说声音,青年声音, |
| zh-CN-YunxiaNeural | 男 | 动漫、有声书 | 可爱 | 认真说话的小男孩 |
| zh-CN-YunyangNeural | 男 | 新闻 | 专业、可靠 | 磁性,专业,成年男生 |
| zh-CN-liaoning-XiaobeiNeural | 女 | 方言(辽宁话) | 幽默 | 地方特色 |
| zh-CN-shaanxi-XiaoniNeural | 女 | 方言(陕西话) | 明亮 | 地方特色 |
| zh-HK-HiuGaaiNeural | 女 | 通用场景 | 友好、积极 | 香港,中年女生 |
| zh-HK-HiuMaanNeural | 女 | 通用场景 | 友好、积极 | 香港,青年女生 |
| zh-HK-WanLungNeural | 男 | 通用场景 | 友好、积极 | 香港,成年男声 |
| zh-TW-HsiaoChenNeural | 女 | 通用场景 | 友好、积极 | 普通话,尾音上翘,青年女声 |
| zh-TW-HsiaoYuNeural | 女 | 通用场景 | 友好、积极 | 普通话,中年女声,略慢一字一字的输出的感觉 |
| zh-TW-YunJheNeural | 男 | 通用场景 | 友好、积极 | 普通话,尾音略轻,成年男声 |

后续

进一步,增加逻辑处理,和功能优化,就直接和Ai交互喽,本章核心内容完结。

相关推荐
CodePlayer竟然被占用了12 分钟前
Codex 用电脑的三种姿势:选错模式,你就白烧 Token
人工智能
袋鼠云数栈UED团队37 分钟前
一套 Spec-First 的 AI 编程工作流
前端·人工智能
Awu12271 小时前
⚡从零开发 Agent CLI(二):CLI 框架搭建与子命令路由
人工智能·aigc
码上天下1 小时前
React Query 缓存 AI 对话历史的几个权衡
人工智能
米小虾1 小时前
2026半年盘点:AI界发生的6件大事,正在彻底改变产业格局
人工智能
道友可好3 小时前
让 AI 自己验收,等于让学生自己批卷
前端·人工智能·后端
美团技术团队3 小时前
美团海报生成 AIGC 技术创新与实践
人工智能
冬哥聊AI4 小时前
放弃 Spring AI?这 3 个开源框架,才是让 SpringBoot 玩转 AI Agent 的正解
人工智能
小爷毛毛_卓寿杰4 小时前
当 max_tokens=1 遇上 reasoning 模型:从 Xagent 一次“测试连接“按钮的失败说起
人工智能