albert - albert技术,学习,经验文章

静静的喝酒

2 年前

深度学习笔记之BERT(二)BERT精简变体:ALBERT上一节从 Word2vec \text{Word2vec} Word2vec上下文信息的局限性角度出发，介绍了 BERT \text{BERT} BERT是如何优化这一问题的，以及 BERT \text{BERT} BERT的训练策略。本节将介绍 BERT \text{BERT} BERT的一种精简变体： ALBERT \text{ALBERT} ALBERT。