语音识别 (ASR)

目标

集成 Paraformer 模型,WAV 音频精准转写为带标点文本。

实现

基于 Eclipse RCP 技术框架开发,企业级应用的技术。
核心组件

  • 前端框架:Eclipse SWT(Standard Widget Toolkit)
  • 推理后端:ONNX Runtime
  • 语音识别模型:Paraformer 等 ONNX 编码器-解码器
  • 语音活动检测:VAD 模型(Silero VAD)
  • 标点恢复模型:基于 BART 的中文标点预测模型(punctuation-zh-bart)

语音识别 (ASR)


应用下载

相关推荐
l1t6 小时前
DeepSeek总结的在 DuckDB 中试驾 Lance 数据湖仓格式
数据库·人工智能·机器学习·duckdb
试剂界的爱马仕6 小时前
《古董局·终局5:潮生》第 2 章:镜子的天赋
大数据·人工智能·算法
Kingairy6 小时前
Agent的发展阶段
人工智能
啦啦啦_99996 小时前
CNN 卷积神经网络
人工智能·神经网络·cnn
TMT星球6 小时前
伴鱼袁志强:AI个性化学习告别“推题时代”,教育 AI Harness 进入学习全过程
人工智能·学习
Rocktech_ruixun6 小时前
从场景落地到技术迭代:服务机器人迈入规模化商用爆发期
大数据·人工智能
Yeats_Liao6 小时前
物联网接入层技术剖析(三):epoll在JVM中的映射
java·linux·jvm·人工智能·物联网
互联圈运营观察6 小时前
布局先行、技术深耕:国内端侧AI企业抢滩机器人与具身智能赛道
人工智能·microsoft·机器人
Want5956 小时前
Rokid AI眼镜实战:打造上海垃圾分类智能助手
人工智能