技术栈
wenet
帅小柏
4 个月前
人工智能
·
语音识别
·
wenet
探索WeNet:一个面向生产的端到端语音识别工具包
在语音识别领域,端到端(E2E)模型因其简化的训练过程和优越的性能而受到越来越多的关注。然而,将这些模型部署到实际应用中并不容易,需要解决流式推理、统一流式和非流式模式以及生产环境中的实际问题。本文介绍了一个名为WeNet的开源语音识别工具包,它通过一个新的两阶段方法U2,实现了在单一模型中统一流式和非流式E2E语音识别。
智慧医疗探索者
10 个月前
语音识别
·
wenet
WeNet2.0:提高端到端ASR的生产力
最近,我们提供了 WeNet [1],这是一个面向生产(=工业生产环境需求)的端到端语音识别工具包,在单个模型中,它引入了统一的两次two-pass (U2) 框架和内置运行时(built-in runtime)来处理流式和非流式解码模式。