我做了一个本地字幕提取工具:软字幕优先 + Whisper 转写回退(支持链接/本地文件)

1. 背景

做剪辑、写稿、做课程笔记时,最耗时间的往往不是观看,而是把视频内容变成可编辑的文字。

市面上工具要么需要上传到云端、要么流程复杂、要么对不同来源兼容性差。我做了一个本地运行的桌面工具,目标是:一键提取字幕,尽量减少手工操作。

2. 设计思路:软字幕优先,转写兜底

字幕来源主要有三类:

  1. 软字幕:容器里自带字幕轨道(SRT/ASS/mov_text/webvtt 等)
  2. 硬字幕:烧录在画面里的文字
  3. 无字幕:只能靠语音识别

工具采用最实用的一条策略:

  • 先探测软字幕轨道(能导出文本就直接提取,准确且快)
  • 没有可用软字幕再进入 Whisper 语音转写(兜底方案,覆盖所有视频)

3. 功能点

  • 支持输入视频链接 / 上传本地文件
  • 自动探测并提取软字幕
  • 无软字幕时自动转写生成字幕
  • 过程进度可见(探测/下载/转写/生成)
  • 结果支持:字幕列表 + 全文复制 + 导出字幕文件

4. 使用场景

  • 短视频脚本文案整理
  • 课程/访谈/会议快速做笔记
  • 素材粗剪前快速提取台词

5. 总结

如果你也经常需要从视频里提取文字,建议先用"软字幕优先 + 转写兜底"的组合策略,会比单纯 OCR/单纯 ASR 更稳。

6. 软件下载地址
7. 软件截图



相关推荐
吱夏cz5 天前
安装whisper
whisper
Jay星晴5 天前
Whisper-large-v3语音识别效果对比:与Whisper v2/v1在中文长语音场景差异
whisper·语音识别·asr·星图gpu
FishPotatoChen8 天前
【OpenAI】Whisper 模型架构详解
whisper
weixin_446260859 天前
[特殊字符] Insanely Fast Whisper - 超快音频转录工具!
whisper·音视频
x-cmd10 天前
[260326] x-cmd v0.8.10:跨 Shell 统一配置命令短名;自动装好依赖运行 WhisperLiveKit 实时语音转写
linux·人工智能·ai·whisper·shortcut·x-cmd
PengShuaiD525 天前
【AI编码】用ChatGPT基于Whisper+ffmpeg实现一个根据视频字幕执行自动化裁剪本地小工具
人工智能·chatgpt·ffmpeg·whisper
susu10830189112 个月前
OpenAI Whisper 把mp3语音转文字
whisper
lili-felicity2 个月前
CANN加速Whisper语音识别推理:流式处理与实时转录优化
人工智能·whisper·语音识别
阿里巴啦2 个月前
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
python·ffmpeg·whisper·音视频·视频处理·ai摘要·音视频转录