使用TTS实现文本转语音

#教程

看书久了眼睛累，尤其就电子书，盯着电脑屏幕或kindle 也累。用过喜马拉雅和微信读书中的语音功能，一是书库有限，想读的书没有收录，二是会员比较贵，充值后也不能完全下载整本书的语音包。遂产生自己动手将文字转为语音，读给我听，这样轻松些。

本文主要转载自Python + edge-tts：一行代码，让你的文本轻松变成语音

技术条件

1.python环境

电脑安装好python，不会的话参考安装教程

2.edge-tts库

安装 edge-tts 库。

bash 复制代码

pip install edge-tts

尝试一下，生成第一个 TTS 语音吧，默认会在本地生成一个 hello.mp3 的音频文件。

text 复制代码

edge-tts --text "Hello, world!" --write-media hello.mp3

参数介绍

这里使用的是默认的语音模型，你还可以通过 --list-voices 选项来查看可用的语音列表，然后通过 --voice 选项来选择你想要的声音。

text 复制代码

edge-tts --list-voices
...

Name: zh-CN-XiaoxiaoNeural
Gender: Female

Name: zh-CN-XiaoyiNeural
Gender: Female

Name: zh-CN-YunjianNeural
Gender: Male

Name: zh-CN-YunxiNeural
Gender: Male

Name: zh-CN-YunxiaNeural
Gender: Male

Name: zh-CN-YunyangNeural
Gender: Male

Name: zh-CN-liaoning-XiaobeiNeural
Gender: Female

Name: zh-CN-shaanxi-XiaoniNeural
Gender: Female

...

edge-tts --voice zh-CN-YunxiNeural --text "你好，我是程序员树先生" --write-media hello_tree.mp3

你还可以通过 --rate 和 --volume 选项来调整语速和音量，-50% 代表降低语速/音量。

text 复制代码

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_with_rate_halved.mp3
edge-tts --volume=-50% --text "Hello, world!" --write-media hello_with_volume_halved.mp3

实现代码

以上是在 cmd 命令行中执行的指令，我们也可以使用 python 进行读取文件内容转语音，

python 复制代码

import edge_tts
import asyncio

TEXT = ""
with open('C:\\Users\\Tree\\Desktop\\text2voicetest.txt', 'rb') as f:
    data = f.read()
    TEXT = data.decode('utf-8')
print(TEXT)
voice = 'zh-CN-YunxiNeural'   #Yunxi 青年 Yunjian 中年   Yunxia  童声  Yunyang  主持人
output = 'C:\\Users\\Tree\\Desktop\\text2voicetest.mp3'  #需要更改自己的桌面路径
rate = '-4%'
volume = '+0%'


async def my_function():
    tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume)
    await tts.save(output)


if __name__ == '__main__':
    asyncio.run(my_function())

在桌面创建一个 text2voicetest.txt 文件，写上你想写的内容，直接运行上述代码，即可生成相应的 MP3 文件。

使用场景

懒人听书；
为博客文章或者电子书添加语音朗读；
为游戏或者动画添加语音配音，让角色更有个性和表现力；
为智能助理添加语音交互；
学习不同语言的发音，或者听取不同声音的风格和情感。

使用TTS实现文本转语音

技术条件

参数介绍

实现代码

使用场景

项目地址