技术栈

唇语识别

提娜米苏
2 小时前
论文阅读·深度学习·计算机视觉·语音识别·知识蒸馏·唇语识别
[论文笔记] ASR is all you need: Cross-modal distillation for lip reading (2020)原文标题:ASR is all you need: Cross-modal distillation for lip reading 发表年份:2020 核心思想:利用强大的 ASR(语音识别)模型作为教师,通过跨模态蒸馏,利用无标签数据训练 VSR(视觉语音识别/唇读)模型。
我是有底线的