论文阅读 BERT GPT - transformer在NLP领域的延伸

文章目录

不会写的很详细,只是为了帮助我理解在CV领域transformer的拓展

1 摘要

1.1 BERT - 核心

双向 编码器 加上mask做完形填空超大模型无监督预训练 需要整个模型作为pretrain weight到下游任务做fintune

1.2 GPT - 核心

自回归 解码器 无需训练 只需Prompt

2 模型架构

2.1 概览


3 区别

3.1 finetune和prompt

BERT需要全部参数进行训练

GPT不需要训练即可完成下游任务

3.2 transformer及训练

BERT使用双向的编码器

GPT使用自回归的解码器

总结

总结个毛

相关推荐
等一个人的@5 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
王莎莎-MinerU6 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
Jmayday11 小时前
NLP第四章:Transformer架构
人工智能·自然语言处理·transformer
森诺Alyson13 小时前
前沿技术借鉴研讨-2026.5.28(眼动数据预测抑郁&自杀倾向)
论文阅读·人工智能·深度学习·分类·论文笔记
z小猫不吃鱼15 小时前
08 BERT 论文精读:双向 Transformer 如何学习语言表示?
学习·bert·transformer
wabs66616 小时前
本科毕业设计项目——基于RAG与大语言模型的408问答系统设计与实现【检索与生成功能的第三步答案生成是怎么实现的?】
人工智能·语言模型·自然语言处理
z小猫不吃鱼17 小时前
07 GPT-1 论文精读:生成式预训练如何用于 NLP 任务?
人工智能·gpt·自然语言处理
财经资讯数据_灵砚智能17 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月28日
大数据·人工智能·python·信息可视化·自然语言处理·ai编程·灵砚智能
学习中.........17 小时前
大语言模型的推理机制与工程应用
人工智能·语言模型·自然语言处理
极光代码工作室17 小时前
基于NLP的招聘信息关键词分析系统
python·深度学习·自然语言处理·nlp