NLP经典入门论文

jingyi1307050082024-05-11 16:41

1.基础部分

Word2Vec

Efficient Estimation of Word Representations in Vector Space

https://arxiv.org/abs/1301.3781v3

Transformer

attention is all you need

https://arxiv.org/abs/1706.03762

BERT

Pre-training of Deep Bidirectional Transformers for Language Understanding

https://arxiv.org/abs/1810.04805

ERNIE

https://arxiv.org/pdf/1904.09223

GPT

gpt1: Improving Language Understanding by Generative Pre-Training

gpt2: Language Models are Unsupervised Multitask Learners

gpt3: Language Models are Few-Shot Learners

2.进阶部分

RoBERTa: A Robustly Optimized BERT Pretraining Approach

上一篇：Jupyter notebook和 Jupyter lab内核死亡问题的原因和解决方案

下一篇：校园论坛系统基于PHP的校园管理系统毕设校园好感度系统校园文化建设系统APP小程序H5前后端源码交付支持二开，一次付款，终生使用

热门推荐

01两千字总结：Codex 国内如何安装和使用的教程，以及如何设置中文回答 02BongoCat - 跨平台键盘猫动画工具 03GitHub 镜像站点 04UV安装并设置国内源 05GitLab 零基础入门指南：从安装到项目管理全流程 06Linux下V2Ray安装配置指南 07Labelme从安装到标注：零基础完整指南 0846个Nano-banana 精选提示词，持续更新中 09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10UV 工具安装与国内镜像源配置指南