小蜗语音工具1.9、文本,小说,字幕生成语音、多角色对话,语音识别、读取音频字幕

小蜗语音免费工具

一、文本转字幕

可以把正本小说,生成字幕文件。不限制文件的大小

文本内容和TXT文件

a、分割字符 :默认通过**,。!--:?""** 来把内容分割成一句一句的字幕,可以自定义

b、删除符号 :默认删除【】=、等符号,删除内容里面的这些特殊符号并且替换为空格,可以自定义

c、删除文字第(.)章(.)|正文卷 ,这个很有用。比如小说里面的章节,正文卷 一些广告词 都可以通过这个来删除。 这是一个正则表达式

多个表达式之前 | 分割。 第(.)章(.) :其中(.)这是匹配所有内容。**第(. )章(.*)** 会匹配类似 第(任何内容)章(任何内容) ,这会删除整行。

而单单输入 正文卷 。就只会删除正文卷 三个字

d、 字符分段 :会自动把一行较长的内容,自动2段或多段字幕

e、文字长度 :指一行字幕的长度,默认20个字。

f、时间微调 :调整一行字幕的时间长短。

二、文本转语音

1、文本内容生成语音

生成数字数量不限可以是几百万

**自动播放:**生成完后,小于10M的会自动播放

**生成srt字幕:**勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

**分段合成:**文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

右边可以选择不同的声音、控制语速等

2、字幕生成语音

自动播放:生成完后,小于10M的会自动播放

声音缩进:指一行字幕声音的伸缩,越大播放时间越短,越短播放时间越长。如果遇到噪声,请使用右边的语速调整

3、多角色对话

在内容区域右键鼠标,可以显示已保存配置的角色

自动播放:生成完后,小于10M的会自动播放

生成srt字幕:勾选后默认会生成 SRT和VTT格式的字幕,字幕语声音一一对应

分段合成:文字大于10万字就会分成一段,10万字大概一段70M。多个文件合成很慢

4、选择文件

这里可以选择TXT文件文本转为语音

5、批量处理

这里是批量把txt文件文本转为语音

三、语音识别、音频MP3

1、语音识别

可以处理 .wav .mp3 .fla .aac .ogg .m4a ,wma .aiff .amr等文件音频转为txt 或者srt

同时支持多个国家的语言。但是要下载模型,完全本地运行。

2、下载模型

下载地址

https://www.vutool.com/

相关推荐
豆芽81922 分钟前
图解YOLO(You Only Look Once)目标检测(v1-v5)
人工智能·深度学习·学习·yolo·目标检测·计算机视觉
算力云44 分钟前
深度剖析!GPT-image-1 API 开放对 AI 绘画技术生态的冲击!
人工智能·openai图像生成模型·gpt-image-1
孤寂码农_defector1 小时前
AI 人工智能模型:从理论到实践的深度解析⚡YQW · Studio ⚡【Deepseek】【Chat GPT】
人工智能
北上ing1 小时前
从FP32到BF16,再到混合精度的全景解析
人工智能·pytorch·深度学习·计算机视觉·stable diffusion
小奕同学A1 小时前
数字化技术的五个环节:大数据、云计算、人工智能、区块链、移动互联网
大数据·人工智能·云计算
Eric.Lee20211 小时前
数据集-目标检测系列- F35 战斗机 检测数据集 F35 plane >> DataBall
人工智能·算法·yolo·目标检测·计算机视觉
白熊1881 小时前
【计算机视觉】CV实践- 基于PaddleSeg的遥感建筑变化检测全解析:从U-Net 3+原理到工程实践
人工智能·计算机视觉
cmoaciopm2 小时前
Obsidian和Ollama大语言模型的交互过程
人工智能·语言模型
努力进修2 小时前
【金仓数据库征文】-金仓数据库性能调优 “快准稳” 攻略:实战优化,让数据处理飞起来
数据库·人工智能·金仓数据库 2025 征文·数据库平替用金仓