字幕视频合成

目标

音频 + 背景图 + 字幕合成硬/软字幕 MP4 视频。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 语音活动检测:VAD 模型(Silero VAD)
  • 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)
  • 字幕视频合成:ffmpeg

字幕视频


应用下载

相关推荐
再一次等风来18 小时前
YOLO26 实测记录:从模型下载、预测验证到 ONNX Runtime 推理部署
yolo·计算机视觉·onnx·yolo26
武子康3 天前
调查研究-173 MOSS-TTS 调查:开源 TTS 正在从“朗读器“走向声音生成系统
人工智能·ai·chatgpt·claude·tts·minimax
kaixinshier5 天前
【无标题】
大模型·人机交互·语音识别·tts·s100p
慢慢向上的蜗牛6 天前
Qwen3-0.6B ONNX(KV-Cache)模型部署
llm·onnx·文本生成·自回归·kv-cache
指尖在键盘上舞动7 天前
RKNN 模型部署:onnx转rknn后精度下降 —— 精度调优与问题排查
python·ubuntu·rk3588·rknn·onnx·npu
MageGojo10 天前
基于 API Zero 平台集成 TTS 语音合成服务的技术实践
python·语音合成·tts·restful api·api集成
云山雾村12 天前
零基础也能用!科哥版Paraformer语音识别WebUI保姆级教程
语音识别·asr·星图gpu·中文语音转文字
Soari14 天前
GitHub 开源项目解析:OpenBMB/VoxCPM —— Tokenizer-Free 多语言语音合成与声音克隆模型
开源·github·语音合成·tts·多语言语音生成