智能字幕(可编辑)

目标

基于 VAD 静音检测与时间轴对齐算法,一键生成 SRT 字幕。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 语音活动检测:VAD 模型(Silero VAD)
  • 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)

智能字幕


应用下载

相关推荐
却道天凉_好个秋1 个月前
音视频学习(九十):再谈srt协议
后端·音视频·srt
中二病码农不会遇见C++学姐2 个月前
SRT文件全解析:从“视频对话本”到时间轴字幕格式
学习·srt
晁好刚3 个月前
语音识别预处理利器,FSMN-VAD实测推荐
语音识别·vad·端点检测·fsmn-vad
lcz-20003 个月前
Silero-VAD模型自定义微调
python·音视频·vad·silero
温柔哥`5 个月前
一种面向整体零样本视频异常分析的统一推理框架
vad·视频异常检测·vlm·异常定位·异常理解·异常推理·推理门控
温柔哥`5 个月前
PANDA:通过代理型 AI 工程师迈向通用视频异常检测
大模型·agent·rag·vad·视频异常检测·工具调用·mllms
zhuweisky10 个月前
C#实现语音预处理:降噪、静音检测、自动增益(附Demo源码)
vad·静音检测·降噪·agc·语音活动检测·自动增益
superconvert10 个月前
最快的流媒体服务器搭建 smart_rtmpd
http·webrtc·rtmp·h264·hls·无人直播·dash·rtsp·gb28181·srt·m3u8·vlc·sfu·obs·flv
温柔哥`10 个月前
Vad-R1:通过从感知到认知的思维链进行视频异常推理
vad·var·视频异常检测·grpo·视频异常推理·推理数据集·强化微调