1. 背景
做剪辑、写稿、做课程笔记时,最耗时间的往往不是观看,而是把视频内容变成可编辑的文字。
市面上工具要么需要上传到云端、要么流程复杂、要么对不同来源兼容性差。我做了一个本地运行的桌面工具,目标是:一键提取字幕,尽量减少手工操作。
2. 设计思路:软字幕优先,转写兜底
字幕来源主要有三类:
- 软字幕:容器里自带字幕轨道(SRT/ASS/mov_text/webvtt 等)
- 硬字幕:烧录在画面里的文字
- 无字幕:只能靠语音识别
工具采用最实用的一条策略:
- 先探测软字幕轨道(能导出文本就直接提取,准确且快)
- 没有可用软字幕再进入 Whisper 语音转写(兜底方案,覆盖所有视频)
3. 功能点
- 支持输入视频链接 / 上传本地文件
- 自动探测并提取软字幕
- 无软字幕时自动转写生成字幕
- 过程进度可见(探测/下载/转写/生成)
- 结果支持:字幕列表 + 全文复制 + 导出字幕文件
4. 使用场景
- 短视频脚本文案整理
- 课程/访谈/会议快速做笔记
- 素材粗剪前快速提取台词
5. 总结
如果你也经常需要从视频里提取文字,建议先用"软字幕优先 + 转写兜底"的组合策略,会比单纯 OCR/单纯 ASR 更稳。
6. 软件下载地址
-
百度网盘链接
链接: https://pan.baidu.com/s/10V1BjeivukBpsQxLQ_ZSsQ?pwd=v6q2 提取码: v6q2
-
夸克网盘链接
链接:https://pan.quark.cn/s/c57b7d5b79a0?pwd=ZUTK
提取码:ZUTK
7. 软件截图


