小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

小蜗语音免费工具

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符 :默认通过**,。!--:?""** 来把内容分割成一句一句的字幕,可以自定义

b、删除符号 :默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义

c、删除文字第(.)章(.)|正文卷 ,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式

多个表达式之前 | 分割。 第(.)章(.) :其中(.)这是匹配所有内容。**第(. )章(.*)** 会匹配类似 第(任何内容)章(任何内容) ,这会删除整行。

而单单输入 正文卷 。就只会删除正文卷 三个字

d、 字符分段 :会自动把一行较长的内容,自动2段或多段字幕

e、文字长度 :指一行字幕的长度,默认20个字。

f、时间微调 :调整一行字幕的时间长短。

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万

**自动播放:**生成完后,小于10M的会自动播放

**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

右边可以选择不同的声音、控制语速等

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放

声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色

自动播放:生成完后,小于10M的会自动播放

生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

4、选择文件

这里可以选择TXT文件文本转为语音

5、批量处理

这里是批量把txt文件文本转为语音

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt

同时支持多个国家的语言。但是要下载模型,完全本地运行。

2、下载模型

下载地址

https://www.vutool.com/

相关推荐
黎燃15 分钟前
AI驱动的供应链管理:需求预测实战指南
人工智能
天波信息技术分享23 分钟前
AI云电脑盒子技术分析——从“盒子”到“算力云边缘节点”的跃迁
人工智能·电脑
CoderJia程序员甲37 分钟前
GitHub 热榜项目 - 日榜(2025-08-16)
人工智能·ai·开源·github
KirkLin38 分钟前
Kirk:练习时长两年半的AI Coding经验
人工智能·程序员·全栈
mit6.82443 分钟前
[1Prompt1Story] 注意力机制增强 IPCA | 去噪神经网络 UNet | U型架构分步去噪
人工智能·深度学习·神经网络
挽淚1 小时前
(小白向)什么是Prompt,RAG,Agent,Function Calling和MCP ?
人工智能·程序员
Jina AI1 小时前
回归C++: 在GGUF上构建高效的向量模型
人工智能·算法·机器学习·数据挖掘·回归
科大饭桶2 小时前
昇腾AI自学Day2-- 深度学习基础工具与数学
人工智能·pytorch·python·深度学习·numpy
什么都想学的阿超2 小时前
【大语言模型 02】多头注意力深度剖析:为什么需要多个头
人工智能·语言模型·自然语言处理
努力还债的学术吗喽2 小时前
2021 IEEE【论文精读】用GAN让音频隐写术骗过AI检测器 - 对抗深度学习的音频信息隐藏
人工智能·深度学习·生成对抗网络·密码学·音频·gan·隐写