技术栈
唇语识别
提娜米苏
2 小时前
论文阅读
·
深度学习
·
计算机视觉
·
语音识别
·
知识蒸馏
·
唇语识别
[论文笔记] ASR is all you need: Cross-modal distillation for lip reading (2020)
原文标题:ASR is all you need: Cross-modal distillation for lip reading 发表年份:2020 核心思想:利用强大的 ASR(语音识别)模型作为教师,通过跨模态蒸馏,利用无标签数据训练 VSR(视觉语音识别/唇读)模型。
我是有底线的