唇语识别 - 唇语识别技术,学习,经验文章

提娜米苏

8 个月前

[论文笔记] ASR is all you need: Cross-modal distillation for lip reading (2020)原文标题：ASR is all you need: Cross-modal distillation for lip reading 发表年份：2020 核心思想：利用强大的 ASR（语音识别）模型作为教师，通过跨模态蒸馏，利用无标签数据训练 VSR（视觉语音识别/唇读）模型。