白嫖edgeTTS 开发了一个在线文字合成语音web

视频翻译配音pyVideoTrans是一个开源的AI工具,用于将视频从一种语言翻译为另一种语言,同时生成该语言的字幕和配音。开源地址 github.com/jianchang51...

视频翻译配音软件也支持单独使用 "文字合成语音" 功能,可将文字使用 edgeTTS openaiTTS GPT-SOVITS 等合成语音,并且支持批量处理、调整语速、对齐字幕等。

但有时仅仅想合成一段文字,使用该软件可能显得有点庞大,在没有安装该软件的电脑上,也不方便使用,单独下载的话体积将近2G,比较耗时,因此专门开发了一个简单免费无限制的"在线文字合成语音"网站,使用edgeTTS将文字合成语音。 ( tts.pyvideotrans.com )

在线合成语音的实现原理

根据输入文字和选项,组装 ssml 格式数据,然后创建websocket连接edge TTS服务器,得到返回音频数据后,合并创建mp3下载到本地。

ini 复制代码
<speak version='1.0' xmlns='http://www.w3.org/2001/10/synthesis' xml:lang='en-US'>
    <voice name='Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoNeural)'>
        <prosody pitch='-50Hz' rate='+0%' volume='+0%'>
        你好啊朋友
        </prosody>
    </voice>
</speak>

主要功能特点有

  • 免费使用,无任何限制

  • 可在手机浏览器中使用

  • 在线输入文字后合成语音

  • 从本地上传txt文件,将文件内的文字合成语音

  • 从本地上传srt字幕文件,将字幕文字合成语音

  • 支持汉语 英语 等几十种语言的数百种配音角色,并且可以调节语速和语调。

  • 合成完毕后会自动下载mp3到本地

使用方法

左侧文本框中输入要合成的文字,或者点击右下角选择从本地上传txt文件或srt字幕文件。

然后选择配音角色,配音角色的前4个字符代表语言和地区,比如"zh-CN"代表中文中国大陆。

再设置速度变化百分百,+0%代表正常速度,大于0的值代表加速,负值代表减速。

音调可选加减多少Hz,这个音调一变,效果相当于换了个人,简章是改变音色,可以尝试不同加减值体验。

最后点击立即启动合成,完成后会以mp3格式自动下载到本地

功能不足之处

受限于服务器资源,与视频翻译配音软件中的文字合成语音功能相比不足之处

  • 不能批量多个文件合成,需要合成完一个文件后,再继续合成另一个,这个后续或许会增加支持,搞成队列一个个来

  • srt 字幕文件不可按照字幕时间戳来合成,而是直接去掉时间戳按照一行一行来合成

  • 仅可实现 edgeTTS 合成,不可以使用其他TTS引擎,比如openai的tts-1模型

  • 不能和字幕对齐,在上传srt字幕后会直接删掉字幕的时间戳行

如果需要这些功能,建议还是下载视频翻译配音软件

体验地址 tts.pyvideotrans.com

相关推荐
逛逛GitHub1 小时前
老外吹爆的国产开源 AI 大模型,登顶了开源热榜第 1。
github
wuk9981 小时前
基于开源操作系统搭建K8S高可用集群
容器·kubernetes·开源
ApacheSeaTunnel2 小时前
LLM 时代,DataAgent × WhaleTunnel 如何将数据库变更瞬时 “转译” 为洞察?
大数据·ai·开源·llm·数据同步·白鲸开源·whaletunnel
天玺-vains3 小时前
借助Github Action实现通过 HTTP 请求触发邮件通知
网络协议·http·github
MobotStone3 小时前
告别就业焦虑!普通人靠AI“工具”创业的3条捷径
开源
武子康3 小时前
AI研究-118 具身智能 Mobile-ALOHA 解读:移动+双臂模仿学习的开源方案(含论文/代码/套件链接)
人工智能·深度学习·学习·机器学习·ai·开源·模仿学习
zachhere7 小时前
构建你的第一个 ChatGPT 应用 | 使用 Apps SDK 的逐步教程
github
jonyleek8 小时前
项目管理太混乱?开源的私有化项目管理系统了解一下!
开源·项目管理·团队开发·甘特图·软件开发·项目管理系统
HelloGitHub9 小时前
降薪跳槽,投身开源!只为 AI 落地“最后一公里”
开源·github