技术栈
roberta
丁学文武
4 小时前
人工智能
·
语言模型
·
nlp
·
bert
·
roberta
·
大模型应用
·
encoder-only
大模型原理与实践:第三章-预训练语言模型详解_第1部分-Encoder-only(BERT、RoBERTa、ALBERT)
第一章 NLP基础概念完整指南第二章 Transformer 架构原理第三章 预训练语言模型第四章 大语言模型
CM莫问
9 个月前
人工智能
·
深度学习
·
算法
·
语言模型
·
自然语言处理
·
大模型
·
roberta
<论文>如何构建一个更鲁棒的Bert?
今天我们来聊一聊论文《RoBERTa: A Robustly Optimized BERT Pretraining Approach》。这篇论文提出了一种更优的Bert训练方案,并将该方案训练的模型称为——RoBERTa。
静静的喝酒
10 个月前
深度学习
·
bert
·
roberta
深度学习笔记之BERT(三)RoBERTa
本节将介绍一种基于 BERT \text{BERT} BERT改进优化的预训练方法—— RoBERTa \text{RoBERTa} RoBERTa。
我是有底线的