使用TTS实现文本转语音

#教程

看书久了眼睛累,尤其就电子书,盯着电脑屏幕或kindle 也累。用过喜马拉雅微信读书中的语音功能,一是书库有限,想读的书没有收录,二是会员比较贵,充值后也不能完全下载整本书的语音包。遂产生自己动手将文字转为语音,读给我听,这样轻松些。

本文主要转载自Python + edge-tts:一行代码,让你的文本轻松变成语音

技术条件

1.python环境

电脑安装好python,不会的话参考安装教程

2.edge-tts库

安装 edge-tts 库。

bash 复制代码
pip install edge-tts
  • 尝试一下,生成第一个 TTS 语音吧,默认会在本地生成一个 hello.mp3 的音频文件。
text 复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3

参数介绍

这里使用的是默认的语音模型,你还可以通过 --list-voices 选项来查看可用的语音列表,然后通过 --voice 选项来选择你想要的声音。

text 复制代码
edge-tts --list-voices
...
​
Name: zh-CN-XiaoxiaoNeural
Gender: Female
​
Name: zh-CN-XiaoyiNeural
Gender: Female
​
Name: zh-CN-YunjianNeural
Gender: Male
​
Name: zh-CN-YunxiNeural
Gender: Male
​
Name: zh-CN-YunxiaNeural
Gender: Male
​
Name: zh-CN-YunyangNeural
Gender: Male
​
Name: zh-CN-liaoning-XiaobeiNeural
Gender: Female
​
Name: zh-CN-shaanxi-XiaoniNeural
Gender: Female
​
...
​
edge-tts --voice zh-CN-YunxiNeural --text "你好,我是程序员树先生" --write-media hello_tree.mp3
  • 你还可以通过 --rate 和 --volume 选项来调整语速和音量,-50% 代表降低语速/音量。
text 复制代码
edge-tts --rate=-50% --text "Hello, world!" --write-media hello_with_rate_halved.mp3
edge-tts --volume=-50% --text "Hello, world!" --write-media hello_with_volume_halved.mp3

实现代码

以上是在 cmd 命令行中执行的指令,我们也可以使用 python 进行读取文件内容转语音,

python 复制代码
import edge_tts
import asyncio
​
TEXT = ""
with open('C:\\Users\\Tree\\Desktop\\text2voicetest.txt', 'rb') as f:
    data = f.read()
    TEXT = data.decode('utf-8')
print(TEXT)
voice = 'zh-CN-YunxiNeural'   #Yunxi 青年 Yunjian 中年   Yunxia  童声  Yunyang  主持人
output = 'C:\\Users\\Tree\\Desktop\\text2voicetest.mp3'  #需要更改自己的桌面路径
rate = '-4%'
volume = '+0%'
​
​
async def my_function():
    tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume)
    await tts.save(output)
​
​
if __name__ == '__main__':
    asyncio.run(my_function())

在桌面创建一个 text2voicetest.txt 文件,写上你想写的内容,直接运行上述代码,即可生成相应的 MP3 文件。

使用场景

  • 懒人听书;
  • 为博客文章或者电子书添加语音朗读;
  • 为游戏或者动画添加语音配音,让角色更有个性和表现力;
  • 为智能助理添加语音交互;
  • 学习不同语言的发音,或者听取不同声音的风格和情感。

项目地址

项目地址

相关推荐
Csvn1 小时前
Python 两大经典坑点 —— 可变默认参数 & 闭包延迟绑定
后端·python
曲幽2 小时前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了
python·docker·web·pot·translate·libretranslate·arogstranslate
用户556918817534 小时前
#从脚本到独立程序:Python + Playwright 批量抓取的完整踩坑记录
python·自动化运维
兵慌码乱18 小时前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
luckdewei20 小时前
FastAPI 资产管理系统实战:复杂 ORM 关联、Alembic 迁移与 N+1 查询优化
python
aqi001 天前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
Csvn1 天前
`functools.lru_cache` —— 一行代码搞定缓存加速
后端·python
金銀銅鐵2 天前
[Python] 从《千字文》中随机挑选汉字
后端·python
cup112 天前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill