完全免费的离线运行的本地音视频转字幕工具,支持一键音视频提取文字,可以导出多种格式!

软件下载

软件介绍

这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。

fast-whisper 开源模型有 tiny/base/small/medium/large-v3, 内置 tiny 模型,tiny->large-v3识别效果越来越好,但所需计算机资源也更多,根据需要可自行下载后解压到 models 目录下即可。

软件特点

  • **支持离线运行:**不联网即可使用
  • **支持导出多种格式****:**支持导出 JSON、SRT 字幕(带时间戳)、TXT 纯文本三种格式。
  • **内置开源大模型:**置 tiny 模型,同时支持下载 base/small/medium/large-v3 等模型替换,平衡识别精度与硬件性能。
  • **支持硬件加速:**支持 CPU 运行,若配置 CUDA 环境可修改为 GPU 加速,提升识别速度。
  • **操作简单:**解压运行即可使用

软件使用

软件解压

软件下载解压即可,解压路径尽可能设置为非中文路径下

软件运行

双击 start.exe ,等待自动打开浏览器窗口即可**(若未能自动打开,请手动打开网址 http://127.0.0.1:9977)**

上传之后就可以识别了

支持导出三个格式

使用GPU

如果机器拥有英伟达GPU,并正确配置了CUDA环境,将自动使用CUDA加速注意:默认使用 cpu 运算,如果确定使用英伟达显卡,并且配置好了cuda 环境,请修改 set.ini 中 devtype=cpudevtype=cuda,并重新启动,可使用cuda加速

相关推荐
2501_942279259 小时前
音频转文本新方案让识别更准、整理更省事
音视频
nashane14 小时前
HarmonyOS 6学习:句柄泄漏(Fd Leak)从“崩溃现场”到“代码行”的精准狙击指南
学习·华为·音视频·harmonyos
君为先-bey16 小时前
VideoReward: 人类反馈优化视频生成文献深度阅读分析
人工智能·音视频·扩散模型
byte轻骑兵17 小时前
【AVRCP】规范精讲[25]: 大数据包拆分传输的完整流程与实战
智能手机·音视频·avrcp·音视频控制·车机蓝牙
君为先-bey18 小时前
CineMaster: 3D感知电影级视频生成框架文献深度阅读分析
3d·音视频·扩散模型
weixin_4199369218 小时前
Grok Imagine 双模型登陆 MetaChat:Arena 榜首图生视频超越seedance2.0 + 旗舰级图像编辑
音视频·grok
南山有乔木78918 小时前
怎么把音频ncm/kgg/m4a格式转换成mp3?手机App和电脑软件都能用的教程
智能手机·音视频
VOOHU-沃虎19 小时前
PoE供电在专业音频设备中的应用:从电源变压器到音频隔离的完整方案
音视频
Deitymoon19 小时前
RV1136——获取VENC的H264码流
音视频
音视频牛哥19 小时前
SmartMediaKit 还是云服务厂商?企业级音视频系统选型背后的技术逻辑
音视频·大牛直播sdk·低延迟rtsp播放器·轻量级rtsp服务器·rtmp同屏推流·smartmediakit·低延迟rtmp播放器