小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

小蜗语音免费工具

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符 :默认通过**,。!--:?""** 来把内容分割成一句一句的字幕,可以自定义

b、删除符号 :默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义

c、删除文字第(.)章(.)|正文卷 ,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式

多个表达式之前 | 分割。 第(.)章(.) :其中(.)这是匹配所有内容。**第(. )章(.*)** 会匹配类似 第(任何内容)章(任何内容) ,这会删除整行。

而单单输入 正文卷 。就只会删除正文卷 三个字

d、 字符分段 :会自动把一行较长的内容,自动2段或多段字幕

e、文字长度 :指一行字幕的长度,默认20个字。

f、时间微调 :调整一行字幕的时间长短。

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万

**自动播放:**生成完后,小于10M的会自动播放

**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

右边可以选择不同的声音、控制语速等

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放

声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色

自动播放:生成完后,小于10M的会自动播放

生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

4、选择文件

这里可以选择TXT文件文本转为语音

5、批量处理

这里是批量把txt文件文本转为语音

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt

同时支持多个国家的语言。但是要下载模型,完全本地运行。

2、下载模型

下载地址

https://www.vutool.com/

相关推荐
拾贰_C17 小时前
【OpenClaw | openai | QQ】 配置QQ qot机器人
运维·人工智能·ubuntu·面试·prompt
码途漫谈17 小时前
Easy-Vibe开发篇阅读笔记(二)——前端开发之Figma与MasterGo入门
人工智能·笔记·ai·开源·ai编程·figma
Jmayday17 小时前
Pytorch:CNN理论基础
人工智能·pytorch·cnn
阿瑞说项目管理17 小时前
2026 智造升级:制造企业 Agent 从 0 到 1 落地指南,五大场景拆解实战路径
人工智能·agent·智能体·企业级ai
Mr_sst17 小时前
infra-ai模块宏观设计解析:业务与模型之间的中间层核心架构
大数据·人工智能·ai·llama
Slow菜鸟17 小时前
Codex CLI 教程(五)| AI 驱动项目从零到一:面向 Java 全栈工程师打造个人 ECC(V2版)
java·开发语言·人工智能
一碗白开水一17 小时前
【论文解读】VMamba: Visual State Space Model
人工智能·计算机视觉
网安情报局17 小时前
如何选择合适的AI大模型:快快云安全AI大模型聚合平台全解析
人工智能·网络安全·ai大模型
yongyoudayee17 小时前
业务语义模型:AI CRM从“能用”到“好用”的技术分水岭
大数据·人工智能
我的世界洛天依17 小时前
官宣|VFrame 企划正式成立:九州合唱团登场,九州网络用 RVC 重构跨 IP 虚拟歌手音乐生态
人工智能·电脑