目标
基于 VAD 静音检测与时间轴对齐算法,一键生成 SRT 字幕。
实现
基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件
- 前端框架:Eclipse SWT(Standard Widget Toolkit)
- 推理后端:ONNX Runtime
- 语音识别模型:Paraformer 等 ONNX 编码器-解码器
- 语音活动检测:VAD 模型(Silero VAD)
- 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)
智能字幕
基于 VAD 静音检测与时间轴对齐算法,一键生成 SRT 字幕。
基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件
智能字幕