技术栈
ieee taslp
语音之家
1 年前
科技
·
macos
·
语音识别
·
xcode
·
ieee taslp
IEEE TASLP | 联合语音识别与口音识别的解耦交互多任务学习网络
尽管联合语音识别(ASR)和口音识别(AR)训练已被证明对处理多口音场景有效,但当前的多任务ASR-AR方法忽视了任务之间的粒度差异。细粒度单元(如音素、声韵母)可用于捕获与发音相关的口音特征,而粗粒度单元(如词,BPE)更适合学习语言信息。此外,两个任务的显式交互也可以提供互补信息并改善彼此的性能,但现有方法很少使用。