使用TTS实现文本转语音

#教程

看书久了眼睛累,尤其就电子书,盯着电脑屏幕或kindle 也累。用过喜马拉雅微信读书中的语音功能,一是书库有限,想读的书没有收录,二是会员比较贵,充值后也不能完全下载整本书的语音包。遂产生自己动手将文字转为语音,读给我听,这样轻松些。

本文主要转载自Python + edge-tts:一行代码,让你的文本轻松变成语音

技术条件

1.python环境

电脑安装好python,不会的话参考安装教程

2.edge-tts库

安装 edge-tts 库。

bash 复制代码
pip install edge-tts
  • 尝试一下,生成第一个 TTS 语音吧,默认会在本地生成一个 hello.mp3 的音频文件。
text 复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3

参数介绍

这里使用的是默认的语音模型,你还可以通过 --list-voices 选项来查看可用的语音列表,然后通过 --voice 选项来选择你想要的声音。

text 复制代码
edge-tts --list-voices
...
​
Name: zh-CN-XiaoxiaoNeural
Gender: Female
​
Name: zh-CN-XiaoyiNeural
Gender: Female
​
Name: zh-CN-YunjianNeural
Gender: Male
​
Name: zh-CN-YunxiNeural
Gender: Male
​
Name: zh-CN-YunxiaNeural
Gender: Male
​
Name: zh-CN-YunyangNeural
Gender: Male
​
Name: zh-CN-liaoning-XiaobeiNeural
Gender: Female
​
Name: zh-CN-shaanxi-XiaoniNeural
Gender: Female
​
...
​
edge-tts --voice zh-CN-YunxiNeural --text "你好,我是程序员树先生" --write-media hello_tree.mp3
  • 你还可以通过 --rate 和 --volume 选项来调整语速和音量,-50% 代表降低语速/音量。
text 复制代码
edge-tts --rate=-50% --text "Hello, world!" --write-media hello_with_rate_halved.mp3
edge-tts --volume=-50% --text "Hello, world!" --write-media hello_with_volume_halved.mp3

实现代码

以上是在 cmd 命令行中执行的指令,我们也可以使用 python 进行读取文件内容转语音,

python 复制代码
import edge_tts
import asyncio
​
TEXT = ""
with open('C:\\Users\\Tree\\Desktop\\text2voicetest.txt', 'rb') as f:
    data = f.read()
    TEXT = data.decode('utf-8')
print(TEXT)
voice = 'zh-CN-YunxiNeural'   #Yunxi 青年 Yunjian 中年   Yunxia  童声  Yunyang  主持人
output = 'C:\\Users\\Tree\\Desktop\\text2voicetest.mp3'  #需要更改自己的桌面路径
rate = '-4%'
volume = '+0%'
​
​
async def my_function():
    tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume)
    await tts.save(output)
​
​
if __name__ == '__main__':
    asyncio.run(my_function())

在桌面创建一个 text2voicetest.txt 文件,写上你想写的内容,直接运行上述代码,即可生成相应的 MP3 文件。

使用场景

  • 懒人听书;
  • 为博客文章或者电子书添加语音朗读;
  • 为游戏或者动画添加语音配音,让角色更有个性和表现力;
  • 为智能助理添加语音交互;
  • 学习不同语言的发音,或者听取不同声音的风格和情感。

项目地址

项目地址

相关推荐
哥本哈士奇(aspnetx)3 小时前
Streamlit + LangChain 1.0 简单实现智能问答前后端
python·大模型
我一定会有钱3 小时前
斐波纳契数列、end关键字
python
小鸡吃米…4 小时前
Python 列表
开发语言·python
星依网络5 小时前
yolov5实现游戏图像识别与后续辅助功能
python·开源·游戏程序·骨骼绑定
大佐不会说日语~5 小时前
Spring AI Alibaba 的 ChatClient 工具注册与 Function Calling 实践
人工智能·spring boot·python·spring·封装·spring ai
2501_921649496 小时前
如何获取美股实时行情:Python 量化交易指南
开发语言·后端·python·websocket·金融
qq_448011166 小时前
python HTTP请求同时返回为JSON的异常处理
python·http·json
棒棒的皮皮6 小时前
【OpenCV】Python图像处理几何变换之翻转
图像处理·python·opencv·计算机视觉
CodeCraft Studio6 小时前
国产化PPT处理控件Spire.Presentation教程:使用Python将图片批量转换为PPT
python·opencv·powerpoint·ppt文档开发·ppt组件库·ppt api
五阿哥永琪7 小时前
Spring Boot 中自定义线程池的正确使用姿势:定义、注入与最佳实践
spring boot·后端·python