字幕视频合成

目标

音频 + 背景图 + 字幕合成硬/软字幕 MP4 视频。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 语音活动检测:VAD 模型(Silero VAD)
  • 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)
  • 字幕视频合成:ffmpeg

字幕视频


应用下载

相关推荐
shao9185164 天前
第11章 Streaming(中):高级音频应用(1)——项目六:语音克隆、变声器与文本转录器
语音识别·tts·语音克隆·elevenlabs·stt·变声器·音乐api
shao9185164 天前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg·whisper·asr·mini-omni·自建语音服务器
vonlycn8 天前
PaddleDetection转ONNX 填坑
python·onnx·paddledetection
Apple_羊先森11 天前
MOSS-TTS-Nano 教程 01:快速上手与整体认识
ai·tts·moss-tts-nano
互联网散修13 天前
鸿蒙实战:运动健康类应用核心组件——语音播报模块设计与实现
华为·harmonyos·tts·语音播报
iwgh15 天前
OddAsr更新:将默认模型从moonshine改回paraformer
asr·paraformer·语音转写·stt·moonshine·oddasr
神州数码云基地18 天前
AI助手语音交互:从技术到体验
人工智能·ai·语音识别·前端开发·tts·ai语音
antzou19 天前
文本转语音(TTS)
tts·文本转语音·matcha·有声书
今夕资源网20 天前
IndexTTS2今夕版最新版本号2026-04-12再次更新 新添加功能SRT字幕文件生成音频 以及生成音频同时生成SRT 字幕文件
音视频·tts·最新版·indextts·语音软件·文字转声音·字幕转音频