roberta

大模型原理与实践：第三章-预训练语言模型详解_第1部分-Encoder-only（BERT、RoBERTa、ALBERT）第一章 NLP基础概念完整指南第二章 Transformer 架构原理第三章预训练语言模型第四章大语言模型

＜论文＞如何构建一个更鲁棒的Bert？今天我们来聊一聊论文《RoBERTa: A Robustly Optimized BERT Pretraining Approach》。这篇论文提出了一种更优的Bert训练方案，并将该方案训练的模型称为——RoBERTa。

静静的喝酒

深度学习笔记之BERT(三)RoBERTa本节将介绍一种基于 BERT \text{BERT} BERT改进优化的预训练方法—— RoBERTa \text{RoBERTa} RoBERTa。

我是有底线的