【AI语音】edge-tts实现文本转语音,免费且音质不错

目标

前边可以翻译大藏经了,拿到翻译文件就想转语音了。这次不要阿里的api的,免费额度少,不免费就有点贵,公益项目用公益资源喽。

结论:

我github访问不了,tts装不上,espeak, MaryTTS,festival,都尝试失败,pyttsx3成功了,但效果真看不上,然后就来到了gitcode.com,搜了一下tts,然后部署了edge-tts,误打误撞还是可以用。

准备:

准备环境,用目前知道的最可心的trae,安装部署参考上一篇文档:

【Ai工具】trae和传统编程环境vs+代码助手的PK,结果大捷-CSDN博客

安装部署

有两种方式:

方式一、可以在Trae中,直接问AI,根据反馈操作:

方式二、参考gitcode文档安装:

地址:GitCode - 全球开发者的开源社区,开源代码托管平台

安装命令:

复制代码
pip install edge-tts

安装成功:

命令行使用:

复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

把文本转成语音hello.mp3,还带字幕hello.srt,乖乖音质不错,字幕更不错:

查一下有哪些声音可用:

复制代码
edge-tts --list-voices

那是非常多,没截全:

重点中文声音是够用的:

代码调用

然后代码实现调用,可以从示例里直接拷贝代码,

当然,也可以让AI帮你写,大家可以参考下面代码,是验证通过的:

复制代码
import asyncio
from edge_tts import Communicate

async def main():
    text = "你好,欢迎使用 Microsoft Edge TTS 服务!"
    voice = "zh-CN-XiaoyiNeural"  # 中文语音,可替换为其他支持的语言和声音

    communicate = Communicate(text, voice)
    await communicate.save("haha.mp3")

# 运行异步任务
asyncio.run(main())

把所有声音输出了一下,总结了一下各声音特点,供大家参考:

|------------------------------|--------|----------|----------|-----------------------|
| 模型名称 | 性别 | 适用场景 | 音色特点 | 备注 |
| zh-CN-XiaoxiaoNeural | 女 | 新闻、有声书 | 温暖 | 柔声,温柔的小女生 |
| zh-CN-XiaoyiNeural | 女 | 动漫、有声书 | 活泼 | 认真说话的小女孩 |
| zh-CN-YunjianNeural | 男 | 体育、有声书 | 激情 | 浑厚,坚定值得信任的中层干部 |
| zh-CN-YunxiNeural | 男 | 有声书 | 活泼、阳光 | 最流行的解说声音,青年声音, |
| zh-CN-YunxiaNeural | 男 | 动漫、有声书 | 可爱 | 认真说话的小男孩 |
| zh-CN-YunyangNeural | 男 | 新闻 | 专业、可靠 | 磁性,专业,成年男生 |
| zh-CN-liaoning-XiaobeiNeural | 女 | 方言(辽宁话) | 幽默 | 地方特色 |
| zh-CN-shaanxi-XiaoniNeural | 女 | 方言(陕西话) | 明亮 | 地方特色 |
| zh-HK-HiuGaaiNeural | 女 | 通用场景 | 友好、积极 | 香港,中年女生 |
| zh-HK-HiuMaanNeural | 女 | 通用场景 | 友好、积极 | 香港,青年女生 |
| zh-HK-WanLungNeural | 男 | 通用场景 | 友好、积极 | 香港,成年男声 |
| zh-TW-HsiaoChenNeural | 女 | 通用场景 | 友好、积极 | 普通话,尾音上翘,青年女声 |
| zh-TW-HsiaoYuNeural | 女 | 通用场景 | 友好、积极 | 普通话,中年女声,略慢一字一字的输出的感觉 |
| zh-TW-YunJheNeural | 男 | 通用场景 | 友好、积极 | 普通话,尾音略轻,成年男声 |

后续

进一步,增加逻辑处理,和功能优化,就直接和Ai交互喽,本章核心内容完结。

相关推荐
小徐Chao努力2 分钟前
【Langchain4j-Java AI开发】09-Agent智能体工作流
java·开发语言·人工智能
Blossom.1187 分钟前
AI编译器实战:从零手写算子融合与自动调度系统
人工智能·python·深度学习·机器学习·flask·transformer·tornado
Coder_Boy_12 分钟前
SpringAI与LangChain4j的智能应用-(理论篇2)
人工智能·spring boot·langchain·springai
却道天凉_好个秋13 分钟前
OpenCV(四十八):图像查找
人工智能·opencv·计算机视觉
Coder_Boy_17 分钟前
SpringAI与LangChain4j的智能应用-(理论篇3)
java·人工智能·spring boot·langchain
GetcharZp29 分钟前
工地“火眼金睛”!手把手带你用 YOLO11 实现安全帽佩戴检测
人工智能·计算机视觉
Codebee30 分钟前
Ooder A2UI架构白皮书
人工智能·响应式编程
Coder_Boy_37 分钟前
基于SpringAI的智能平台基座开发-(六)
java·数据库·人工智能·spring·langchain·langchain4j
泰迪智能科技0141 分钟前
分享图书推荐 | 数字图像处理实战
人工智能·深度学习·计算机视觉
北京盟通科技官方账号1 小时前
精准医疗的未来之一:EtherCAT携手实时解决方案助力医疗器械中的控制与传输
人工智能·机器人·自动化·健康医疗·制造