小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

小蜗语音免费工具

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符 :默认通过**,。!--:?""** 来把内容分割成一句一句的字幕,可以自定义

b、删除符号 :默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义

c、删除文字第(.)章(.)|正文卷 ,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式

多个表达式之前 | 分割。 第(.)章(.) :其中(.)这是匹配所有内容。**第(. )章(.*)** 会匹配类似 第(任何内容)章(任何内容) ,这会删除整行。

而单单输入 正文卷 。就只会删除正文卷 三个字

d、 字符分段 :会自动把一行较长的内容,自动2段或多段字幕

e、文字长度 :指一行字幕的长度,默认20个字。

f、时间微调 :调整一行字幕的时间长短。

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万

**自动播放:**生成完后,小于10M的会自动播放

**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

右边可以选择不同的声音、控制语速等

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放

声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色

自动播放:生成完后,小于10M的会自动播放

生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

4、选择文件

这里可以选择TXT文件文本转为语音

5、批量处理

这里是批量把txt文件文本转为语音

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt

同时支持多个国家的语言。但是要下载模型,完全本地运行。

2、下载模型

下载地址

https://www.vutool.com/

相关推荐
编码浪子3 分钟前
Transformer的编码机制
人工智能·深度学习·transformer
芥末的无奈16 分钟前
GStreamer 简明教程(九):插件开发,以一个音频特效插件为例
音视频·gstreamer
IE0617 分钟前
深度学习系列76:流式tts的一个简单实现
人工智能·深度学习
GIS数据转换器21 分钟前
城市生命线安全保障:技术应用与策略创新
大数据·人工智能·安全·3d·智慧城市
一水鉴天2 小时前
为AI聊天工具添加一个知识系统 之65 详细设计 之6 变形机器人及伺服跟随
人工智能
井底哇哇8 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证8 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩8 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控8 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉
一水鉴天9 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python