技术栈

视觉语音识别

提娜米苏
2 小时前
论文阅读·深度学习·计算机视觉·lstm·语音识别·视觉语音识别
[论文笔记] 基于 LSTM 的端到端视觉语音识别 (End-to-End Visual Speech Recognition with LSTMs)原文标题:End-to-End Visual Speech Recognition with LSTMs 发表年份:2017 核心思想:如何显式地让网络同时关注唇部的“形状”和“运动”,实现从像素到语义的端到端识别。
我是有底线的