NLP论文

LANWENBING2023-07-19 8:50

BERT(bidirectional encoder representations from transformer)是谷歌公司发明的，基于自注意力机制的nlp模型。有预训练好的模型，并且开源的供所有人去做调优。是2018年的时候最优秀的nlp模型。

训练方式：自编码（Autoencoding）

预测目标：给定上下文，预测其中的一个或多个缺失单词

输入处理：双向，可以同时考虑一个词的左右上下文

适用场景：适合理解上下文，有助于信息提取、问答系统、情感分析等

架构：基于Transformer的编码器

语言模型：判别式（Discriminative）

优点：对上下文理解能力较强

缺点：生成的文本连贯性较弱

GitHub - google-research/bert: TensorFlow code and pre-trained models for BERT

GitHub - ymcui/Chinese-BERT-wwm: Pre-Training with Whole Word Masking for Chinese BERT（中文BERT-wwm系列模型）

GPT(Generative Pretrained Transformer)

训练方式：自回归（Autoregressive）

预测目标：在给定前面的单词时，预测下一个单词

输入处理：单向（从左往右或者从右往左）

适用场景：适合生成式任务，如文章生成、诗歌创作等

架构：基于Transformer的解码器

语言模型：生成式（Generative）

优点：预测的连贯性较强

缺点：对上下文理解能力相对较弱

T5
Bart

可以去仔细阅读的文章如下：（待读）

Attention is all you need
BERT：Pre-training of Deep Bidirectional Transformer for language understanding
GPT体验

https://poe.com/

上一篇：二次元少女-InsCode Stable Diffusion 美图活动一期

下一篇：MySQL存储过程使用嵌套游标

热门推荐

01GitHub 镜像站点 02综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 03UV安装并设置国内源 04Linux下V2Ray安装配置指南 05npm使用国内淘宝镜像的方法 06安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）07BongoCat - 跨平台键盘猫动画工具 08《大数据技术原理与应用》实验报告三熟悉HBase常用操作 09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10GitLab 零基础入门指南：从安装到项目管理全流程