论文阅读 BERT GPT - transformer在NLP领域的延伸

文章目录

不会写的很详细,只是为了帮助我理解在CV领域transformer的拓展

1 摘要

1.1 BERT - 核心

双向 编码器 加上mask做完形填空超大模型无监督预训练 需要整个模型作为pretrain weight到下游任务做fintune

1.2 GPT - 核心

自回归 解码器 无需训练 只需Prompt

2 模型架构

2.1 概览


3 区别

3.1 finetune和prompt

BERT需要全部参数进行训练

GPT不需要训练即可完成下游任务

3.2 transformer及训练

BERT使用双向的编码器

GPT使用自回归的解码器

总结

总结个毛

相关推荐
这张生成的图像能检测吗3 小时前
(论文速读)探索多模式大型语言模型的视觉缺陷
人工智能·深度学习·算法·计算机视觉·语言模型·自然语言处理
图灵学术计算机论文辅导7 小时前
从 “看懂图” 到 “读懂视频”:多模态技术如何用文本反哺视觉?
论文阅读·人工智能·学习·考研·计算机视觉·目标跟踪
张较瘦_8 小时前
[论文阅读] 人工智能 + 教学 | 从代码到职业:用机器学习预测竞赛程序员的就业潜力
论文阅读·人工智能·机器学习
s1ckrain8 小时前
【论文阅读】Transformer Feed-Forward Layers Are Key-Value Memories
论文阅读·深度学习·语言模型·transformer
云渚钓月梦未杳8 小时前
NLP自然语言处理 03 Transformer架构
人工智能·自然语言处理·transformer
大千AI助手9 小时前
FLAN-T5:大规模指令微调的统一语言模型框架
人工智能·神经网络·语言模型·自然语言处理·微调·t5·finetune
java1234_小锋9 小时前
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博舆情数据可视化分析-热词情感趋势柱状图
python·信息可视化·自然语言处理
静心问道18 小时前
量化大型语言模型的评估
人工智能·语言模型·自然语言处理
有Li21 小时前
探索医学领域多模态人工智能的发展图景:技术挑战与临床应用的范围综述|文献速递-医学影像算法文献分享
论文阅读·人工智能·医学生
知来者逆1 天前
LLM开发——基于Graph RAG知识图谱检索增强生成
人工智能·语言模型·自然语言处理·知识图谱