AI文字有声书

目标

语音词典:校正多音字拼音以及声调读音。

文本转语音:长文本自然合成音频文件,同步生成字幕文件。

拼音词典:校正多音字与冷门词注音。

字幕视频:音频 + 背景图 + 字幕合成硬/软字幕 MP4 视频。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 文本注音 :pinyin

AI文字有声


应用下载

相关推荐
Agent手记8 小时前
工厂货物智能入库全流程自动化:基于实在Agent与ISSUT技术的2026工业自动化实战指南
运维·人工智能·ai·自动化
五月底_8 小时前
Transformer
人工智能·深度学习
舞影天上8 小时前
我用 Docker 自托管了 AI 记忆系统,踩了 5 个坑全记录
人工智能
无心水9 小时前
【Hermes:安全、权限与生产环境】39、智能体也会犯错?Hermes 纠错、回滚与遗忘机制全指南 —— 让 AI 的错误像 Git 一样可逆可控
人工智能·git·安全·mcp协议·openclaw·hermes·honcho
小白编程锤炼9 小时前
深入解析:质量门禁
人工智能·算法·架构·vibe-coding
Ares-Wang9 小时前
AI》》 监督学习,无监督学习,半监督学习、强化学习 、深度学习 统计学的常用方法
人工智能·深度学习·学习
江瀚视野9 小时前
DeepWay深向盈利拐点趋近意味着什么?
大数据·人工智能
爱学习的张大9 小时前
KG与LLM:大模型时代的智能规划
人工智能
三维重建-光栅投影9 小时前
线性代数之超定方程使用最小二乘求解
人工智能·线性代数
老码观察9 小时前
数环通iPaaS知识库选型实践:从技术评估到RAGFlow深度调优
人工智能·agent·知识库