小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

小蜗语音免费工具

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符 :默认通过**,。!--:?""** 来把内容分割成一句一句的字幕,可以自定义

b、删除符号 :默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义

c、删除文字第(.)章(.)|正文卷 ,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式

多个表达式之前 | 分割。 第(.)章(.) :其中(.)这是匹配所有内容。**第(. )章(.*)** 会匹配类似 第(任何内容)章(任何内容) ,这会删除整行。

而单单输入 正文卷 。就只会删除正文卷 三个字

d、 字符分段 :会自动把一行较长的内容,自动2段或多段字幕

e、文字长度 :指一行字幕的长度,默认20个字。

f、时间微调 :调整一行字幕的时间长短。

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万

**自动播放:**生成完后,小于10M的会自动播放

**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

右边可以选择不同的声音、控制语速等

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放

声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色

自动播放:生成完后,小于10M的会自动播放

生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

4、选择文件

这里可以选择TXT文件文本转为语音

5、批量处理

这里是批量把txt文件文本转为语音

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt

同时支持多个国家的语言。但是要下载模型,完全本地运行。

2、下载模型

下载地址

https://www.vutool.com/

相关推荐
有Li3 分钟前
跨中心模型自适应牙齿分割|文献速递-医学影像人工智能进展
人工智能
牧歌悠悠5 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬5 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬5 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构
jixunwulian5 小时前
DeepSeek赋能AI边缘计算网关,开启智能新时代!
人工智能·边缘计算
Archie_IT5 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
大数据追光猿5 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法
灵感素材坊6 小时前
解锁音乐创作新技能:AI音乐网站的正确使用方式
人工智能·经验分享·音视频
modest —YBW7 小时前
视频大小怎么计算?视频码率是什么,构成视频清晰度的核心要素!
音视频
cuijiecheng20187 小时前
音视频入门基础:RTP专题(10)——FFmpeg源码中,解析RTP header的实现
ffmpeg·音视频