技术栈

ieee taslp

语音之家
2 年前
科技·macos·语音识别·xcode·ieee taslp
IEEE TASLP | 联合语音识别与口音识别的解耦交互多任务学习网络尽管联合语音识别(ASR)和口音识别(AR)训练已被证明对处理多口音场景有效,但当前的多任务ASR-AR方法忽视了任务之间的粒度差异。细粒度单元(如音素、声韵母)可用于捕获与发音相关的口音特征,而粗粒度单元(如词,BPE)更适合学习语言信息。此外,两个任务的显式交互也可以提供互补信息并改善彼此的性能,但现有方法很少使用。