使用TTS实现文本转语音

#教程

看书久了眼睛累,尤其就电子书,盯着电脑屏幕或kindle 也累。用过喜马拉雅微信读书中的语音功能,一是书库有限,想读的书没有收录,二是会员比较贵,充值后也不能完全下载整本书的语音包。遂产生自己动手将文字转为语音,读给我听,这样轻松些。

本文主要转载自Python + edge-tts:一行代码,让你的文本轻松变成语音

技术条件

1.python环境

电脑安装好python,不会的话参考安装教程

2.edge-tts库

安装 edge-tts 库。

bash 复制代码
pip install edge-tts
  • 尝试一下,生成第一个 TTS 语音吧,默认会在本地生成一个 hello.mp3 的音频文件。
text 复制代码
edge-tts --text "Hello, world!" --write-media hello.mp3

参数介绍

这里使用的是默认的语音模型,你还可以通过 --list-voices 选项来查看可用的语音列表,然后通过 --voice 选项来选择你想要的声音。

text 复制代码
edge-tts --list-voices
...
​
Name: zh-CN-XiaoxiaoNeural
Gender: Female
​
Name: zh-CN-XiaoyiNeural
Gender: Female
​
Name: zh-CN-YunjianNeural
Gender: Male
​
Name: zh-CN-YunxiNeural
Gender: Male
​
Name: zh-CN-YunxiaNeural
Gender: Male
​
Name: zh-CN-YunyangNeural
Gender: Male
​
Name: zh-CN-liaoning-XiaobeiNeural
Gender: Female
​
Name: zh-CN-shaanxi-XiaoniNeural
Gender: Female
​
...
​
edge-tts --voice zh-CN-YunxiNeural --text "你好,我是程序员树先生" --write-media hello_tree.mp3
  • 你还可以通过 --rate 和 --volume 选项来调整语速和音量,-50% 代表降低语速/音量。
text 复制代码
edge-tts --rate=-50% --text "Hello, world!" --write-media hello_with_rate_halved.mp3
edge-tts --volume=-50% --text "Hello, world!" --write-media hello_with_volume_halved.mp3

实现代码

以上是在 cmd 命令行中执行的指令,我们也可以使用 python 进行读取文件内容转语音,

python 复制代码
import edge_tts
import asyncio
​
TEXT = ""
with open('C:\\Users\\Tree\\Desktop\\text2voicetest.txt', 'rb') as f:
    data = f.read()
    TEXT = data.decode('utf-8')
print(TEXT)
voice = 'zh-CN-YunxiNeural'   #Yunxi 青年 Yunjian 中年   Yunxia  童声  Yunyang  主持人
output = 'C:\\Users\\Tree\\Desktop\\text2voicetest.mp3'  #需要更改自己的桌面路径
rate = '-4%'
volume = '+0%'
​
​
async def my_function():
    tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume)
    await tts.save(output)
​
​
if __name__ == '__main__':
    asyncio.run(my_function())

在桌面创建一个 text2voicetest.txt 文件,写上你想写的内容,直接运行上述代码,即可生成相应的 MP3 文件。

使用场景

  • 懒人听书;
  • 为博客文章或者电子书添加语音朗读;
  • 为游戏或者动画添加语音配音,让角色更有个性和表现力;
  • 为智能助理添加语音交互;
  • 学习不同语言的发音,或者听取不同声音的风格和情感。

项目地址

项目地址

相关推荐
love530love1 小时前
【保姆级教程】阿里 Wan2.1-T2V-14B 模型本地部署全流程:从环境配置到视频生成(附避坑指南)
人工智能·windows·python·开源·大模型·github·音视频
He1955011 小时前
Go初级之十:错误处理与程序健壮性
开发语言·python·golang
和鲸社区2 小时前
《斯坦福CS336》作业1开源,从0手搓大模型|代码复现+免环境配置
人工智能·python·深度学习·计算机视觉·语言模型·自然语言处理·nlp
豌豆花下猫3 小时前
Python 潮流周刊#118:Python 异步为何不够流行?(摘要)
后端·python·ai
THMAIL3 小时前
深度学习从入门到精通 - LSTM与GRU深度剖析:破解长序列记忆遗忘困境
人工智能·python·深度学习·算法·机器学习·逻辑回归·lstm
wheeldown3 小时前
【数学建模】数据预处理入门:从理论到动手操作
python·数学建模·matlab·python3.11
多打代码3 小时前
2025.09.05 用队列实现栈 & 有效的括号 & 删除字符串中的所有相邻重复项
python·算法
@CLoudbays_Martin114 小时前
为什么动态视频业务内容不可以被CDN静态缓存?
java·运维·服务器·javascript·网络·python·php
程序猿炎义4 小时前
【NVIDIA AIQ】自定义函数实践
人工智能·python·学习
THMAIL4 小时前
深度学习从入门到精通 - BERT与预训练模型:NLP领域的核弹级技术详解
人工智能·python·深度学习·自然语言处理·性能优化·bert