【AI语音】edge-tts实现文本转语音,免费且音质不错

目标

前边可以翻译大藏经了,拿到翻译文件就想转语音了。这次不要阿里的api的,免费额度少,不免费就有点贵,公益项目用公益资源喽。

结论:

我github访问不了,tts装不上,espeak, MaryTTS,festival,都尝试失败,pyttsx3成功了,但效果真看不上,然后就来到了gitcode.com,搜了一下tts,然后部署了edge-tts,误打误撞还是可以用。

准备:

准备环境,用目前知道的最可心的trae,安装部署参考上一篇文档:

【Ai工具】trae和传统编程环境vs+代码助手的PK,结果大捷-CSDN博客

安装部署

有两种方式:

方式一、可以在Trae中,直接问AI,根据反馈操作:

方式二、参考gitcode文档安装:

地址:GitCode - 全球开发者的开源社区,开源代码托管平台

安装命令:

复制代码
pip install edge-tts

安装成功:

命令行使用:

复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

把文本转成语音hello.mp3,还带字幕hello.srt,乖乖音质不错,字幕更不错:

查一下有哪些声音可用:

复制代码
edge-tts --list-voices

那是非常多,没截全:

重点中文声音是够用的:

代码调用

然后代码实现调用,可以从示例里直接拷贝代码,

当然,也可以让AI帮你写,大家可以参考下面代码,是验证通过的:

复制代码
import asyncio
from edge_tts import Communicate

async def main():
    text = "你好,欢迎使用 Microsoft Edge TTS 服务!"
    voice = "zh-CN-XiaoyiNeural"  # 中文语音,可替换为其他支持的语言和声音

    communicate = Communicate(text, voice)
    await communicate.save("haha.mp3")

# 运行异步任务
asyncio.run(main())

把所有声音输出了一下,总结了一下各声音特点,供大家参考:

|------------------------------|--------|----------|----------|-----------------------|
| 模型名称 | 性别 | 适用场景 | 音色特点 | 备注 |
| zh-CN-XiaoxiaoNeural | 女 | 新闻、有声书 | 温暖 | 柔声,温柔的小女生 |
| zh-CN-XiaoyiNeural | 女 | 动漫、有声书 | 活泼 | 认真说话的小女孩 |
| zh-CN-YunjianNeural | 男 | 体育、有声书 | 激情 | 浑厚,坚定值得信任的中层干部 |
| zh-CN-YunxiNeural | 男 | 有声书 | 活泼、阳光 | 最流行的解说声音,青年声音, |
| zh-CN-YunxiaNeural | 男 | 动漫、有声书 | 可爱 | 认真说话的小男孩 |
| zh-CN-YunyangNeural | 男 | 新闻 | 专业、可靠 | 磁性,专业,成年男生 |
| zh-CN-liaoning-XiaobeiNeural | 女 | 方言(辽宁话) | 幽默 | 地方特色 |
| zh-CN-shaanxi-XiaoniNeural | 女 | 方言(陕西话) | 明亮 | 地方特色 |
| zh-HK-HiuGaaiNeural | 女 | 通用场景 | 友好、积极 | 香港,中年女生 |
| zh-HK-HiuMaanNeural | 女 | 通用场景 | 友好、积极 | 香港,青年女生 |
| zh-HK-WanLungNeural | 男 | 通用场景 | 友好、积极 | 香港,成年男声 |
| zh-TW-HsiaoChenNeural | 女 | 通用场景 | 友好、积极 | 普通话,尾音上翘,青年女声 |
| zh-TW-HsiaoYuNeural | 女 | 通用场景 | 友好、积极 | 普通话,中年女声,略慢一字一字的输出的感觉 |
| zh-TW-YunJheNeural | 男 | 通用场景 | 友好、积极 | 普通话,尾音略轻,成年男声 |

后续

进一步,增加逻辑处理,和功能优化,就直接和Ai交互喽,本章核心内容完结。

相关推荐
若叶时代10 分钟前
数据分析_Python
人工智能·python·数据分析
虾球xz13 分钟前
游戏引擎学习第286天:开始解耦实体行为
c++·人工智能·学习·游戏引擎
武子康15 分钟前
大语言模型 11 - 从0开始训练GPT 0.25B参数量 MiniMind2 准备数据与训练模型 DPO直接偏好优化
人工智能·gpt·ai·语言模型·自然语言处理
羽凌寒1 小时前
图像对比度调整(局域拉普拉斯滤波)
人工智能·计算机视觉
大模型铲屎官1 小时前
【Python-Day 14】玩转Python字典(上篇):从零开始学习创建、访问与操作
开发语言·人工智能·pytorch·python·深度学习·大模型·字典
一点.点1 小时前
计算机视觉的简单介绍
人工智能·深度学习·计算机视觉
量子-Alex2 小时前
【目标检测】【Transformer】Swin Transformer
人工智能·目标检测·transformer
GISer_Jing2 小时前
AI知识梳理——RAG、Agent、ReAct、LangChain、LangGraph、MCP、Function Calling、JSON-RPC
人工智能
Stara05112 小时前
基于多头自注意力机制(MHSA)增强的YOLOv11主干网络—面向高精度目标检测的结构创新与性能优化
人工智能·python·深度学习·神经网络·目标检测·计算机视觉·yolov11
YuSun_WK2 小时前
目标跟踪相关综述文章
人工智能·计算机视觉·目标跟踪