字幕视频合成

目标

音频 + 背景图 + 字幕合成硬/软字幕 MP4 视频。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 语音活动检测:VAD 模型(Silero VAD)
  • 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)
  • 字幕视频合成:ffmpeg

字幕视频


应用下载

相关推荐
antzou1 天前
智能字幕(可编辑)
srt·vad
antzou2 天前
语音识别 (ASR)
人工智能·语音识别·onnx·asr·paraformer
花千树-0103 天前
基于 IndexTTS2 的数字人语音生成 Pipeline 设计
人工智能·aigc·ai编程·tts
花千树-0105 天前
IndexTTS2 推理性能分析
人工智能·深度学习·ai·语音识别·tts
七夜zippoe7 天前
OpenClaw TTS 语音合成详解:让 AI 助手开口说话
人工智能·ai·语音合成·tts·openclaw
aosky10 天前
OmniVoice:支持 600+ 语言的零样本语音克隆 TTS 系统
人工智能·tts
小垣11 天前
java调用yolo26n.onnx模型输出图像推理检测
java·人工智能·深度学习·onnx
桑榆肖物13 天前
有字幕,没配音?用浏览器自带语音能力,让网页视频直接“开口说话”
数据库·edge·音视频·tts
七夜zippoe13 天前
模型部署优化:ONNX与TensorRT实战——从训练到推理的完整优化链路
人工智能·python·tensorflow·tensorrt·onnx