我做了一个本地字幕提取工具:软字幕优先 + Whisper 转写回退(支持链接/本地文件)

1. 背景

做剪辑、写稿、做课程笔记时,最耗时间的往往不是观看,而是把视频内容变成可编辑的文字。

市面上工具要么需要上传到云端、要么流程复杂、要么对不同来源兼容性差。我做了一个本地运行的桌面工具,目标是:一键提取字幕,尽量减少手工操作。

2. 设计思路:软字幕优先,转写兜底

字幕来源主要有三类:

  1. 软字幕:容器里自带字幕轨道(SRT/ASS/mov_text/webvtt 等)
  2. 硬字幕:烧录在画面里的文字
  3. 无字幕:只能靠语音识别

工具采用最实用的一条策略:

  • 先探测软字幕轨道(能导出文本就直接提取,准确且快)
  • 没有可用软字幕再进入 Whisper 语音转写(兜底方案,覆盖所有视频)

3. 功能点

  • 支持输入视频链接 / 上传本地文件
  • 自动探测并提取软字幕
  • 无软字幕时自动转写生成字幕
  • 过程进度可见(探测/下载/转写/生成)
  • 结果支持:字幕列表 + 全文复制 + 导出字幕文件

4. 使用场景

  • 短视频脚本文案整理
  • 课程/访谈/会议快速做笔记
  • 素材粗剪前快速提取台词

5. 总结

如果你也经常需要从视频里提取文字,建议先用"软字幕优先 + 转写兜底"的组合策略,会比单纯 OCR/单纯 ASR 更稳。

6. 软件下载地址
7. 软件截图



相关推荐
abigriver1 天前
打造 Linux 离线大模型级语音输入法:Whisper.cpp + 3090 显卡加速与 Rime 中英混输终极调优指南
linux·运维·whisper
J心流6 天前
89ms实时Whisper,显存还降48%
whisper
iDao技术魔方10 天前
whisper.cpp 深度解析:从边缘设备到实时语音识别
人工智能·whisper·语音识别
Gc9umsbL114 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg·whisper·音视频
Bofu-17 天前
【音频测试】03-WPF 实现声道自动验证 + Whisper 语音识别录音检测
c#·whisper·wpf·音视频·音频测试·naudio 声道控制
JK Chen20 天前
faster_whisper,视频转文字,并生成字幕文件
python·whisper·音视频
工作log22 天前
10分钟搭建本地语音识别服务 (Whisper large-v3-turbo)
人工智能·whisper·语音识别
shao91851623 天前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg·whisper·asr·mini-omni·自建语音服务器
code_pgf1 个月前
MNN Whisper 实时 ASR 工程实现
人工智能·whisper·mnn
独占的甜蜜1 个月前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析过程
ffmpeg·whisper·音视频