nar非自回归 - nar非自回归技术,学习,经验文章

木亦汐丫

1 年前

【ASR】基于分块非自回归模型的流式端到端语音识别论文地址：https://arxiv.org/abs/2107.09428非自回归 (NAR) 模型在语音处理中越来越受到关注。凭借最新的基于注意力的自动语音识别 (ASR) 结构，与自回归 (AR) 模型相比，NAR 可以在仅精度略有下降的情况下实现有前景的实时因子 (RTF) 提升。然而，识别推理需要等待完整语音话语的完成，这限制了其在低延迟场景中的应用。为了解决这个问题，我们提出了一种新颖的端到端流式 NAR 语音识别系统，该系统结合了分块注意力和带有掩码预测 (Mask-CTC) NAR 的