我做了一个本地字幕提取工具:软字幕优先 + Whisper 转写回退(支持链接/本地文件)

1. 背景

做剪辑、写稿、做课程笔记时,最耗时间的往往不是观看,而是把视频内容变成可编辑的文字。

市面上工具要么需要上传到云端、要么流程复杂、要么对不同来源兼容性差。我做了一个本地运行的桌面工具,目标是:一键提取字幕,尽量减少手工操作。

2. 设计思路:软字幕优先,转写兜底

字幕来源主要有三类:

  1. 软字幕:容器里自带字幕轨道(SRT/ASS/mov_text/webvtt 等)
  2. 硬字幕:烧录在画面里的文字
  3. 无字幕:只能靠语音识别

工具采用最实用的一条策略:

  • 先探测软字幕轨道(能导出文本就直接提取,准确且快)
  • 没有可用软字幕再进入 Whisper 语音转写(兜底方案,覆盖所有视频)

3. 功能点

  • 支持输入视频链接 / 上传本地文件
  • 自动探测并提取软字幕
  • 无软字幕时自动转写生成字幕
  • 过程进度可见(探测/下载/转写/生成)
  • 结果支持:字幕列表 + 全文复制 + 导出字幕文件

4. 使用场景

  • 短视频脚本文案整理
  • 课程/访谈/会议快速做笔记
  • 素材粗剪前快速提取台词

5. 总结

如果你也经常需要从视频里提取文字,建议先用"软字幕优先 + 转写兜底"的组合策略,会比单纯 OCR/单纯 ASR 更稳。

6. 软件下载地址
7. 软件截图



相关推荐
PengShuaiD55 天前
【AI编码】用ChatGPT基于Whisper+ffmpeg实现一个根据视频字幕执行自动化裁剪本地小工具
人工智能·chatgpt·ffmpeg·whisper
susu10830189111 个月前
OpenAI Whisper 把mp3语音转文字
whisper
lili-felicity1 个月前
CANN加速Whisper语音识别推理:流式处理与实时转录优化
人工智能·whisper·语音识别
阿里巴啦1 个月前
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
python·ffmpeg·whisper·音视频·视频处理·ai摘要·音视频转录
普通网友1 个月前
极致压缩:Whisper.cpp 量化版本清单与 ggml 格式模型下载
whisper
天空中最亮的一颗星1 个月前
如何下载、安装whisper、faster_whisper?
whisper
runner365.git1 个月前
ffmpeg8.0合入whisper,语音识别模型终于进入ffmpeg
ffmpeg·whisper·语音识别
Blossom.1181 个月前
从单点工具到智能流水线:企业级多智能体AI开发工作流架构实战
人工智能·笔记·python·深度学习·神经网络·架构·whisper
Blossom.1181 个月前
从“金鱼记忆“到“超级大脑“:2025年AI智能体记忆机制与MoE架构的融合革命
人工智能·python·算法·架构·自动化·whisper·哈希算法