最近发现一款非常好用的语音转文字的工具Whisper,支持将视频和语音转换成文字,同时记录语音的位置信息,支持语言的翻译,可以将英文转换成中文。同时支持实时的语音自动采集录制。
下面是下载的地址:
一、语言模型的配置
大家下载好文件之后,点击可执行文件,第一步先要配置好语言模型:
请从网盘下载:
链接:https://pan.quark.cn/s/22fbeb480e6a
提取码:45qY
![](https://file.jishuzhan.net/article/1747156223926472705/ef3aef7da9f8df121a396f0cafca08d4.webp)
二、语音转文字
如下图:选择要转换的视频或语音文件,然后选择输出格式,输出格式4种:
1、Text 纯文本
2、Text with timestamp 纯文本+时间戳(文字出现的时间点)
3、SubRip subtitles 字幕格式
4、WebVTT subtitles H5的web视频字幕格式
![](https://file.jishuzhan.net/article/1747156223926472705/5045b298a2519409618406e9af72ca8d.webp)
选择Transcribe即可开始进行语音到文字的转换。
三、通过语音设备采集
![](https://file.jishuzhan.net/article/1747156223926472705/d789a3f6880b995b46d13ea1255f6fb2.webp)
这里需要选择采集的MIC设备,然后选择Capture 按钮就可以啦。