生成式大语言模型论文导读

当下,最火的人工智能无疑就是生成式大模型,包括纯大语言模型和多模态模型,所以本次也抱着学习的态度,以大模型发展的时间线来对主要节点的一些生成式语言模型的论文进行分享(论文和分享内容会动态更新)。

分享目录

transformer原理-Attention Is All You Need -2017(待补充)
GPT-1原理-Improving Language Understanding by Generative Pre-Training -2018
BERT原理-Pre-training of Deep Bidirectional Transformers for Language Understanding -2018
GPT-2原理-Language Models are Unsupervised Multitask Learners -2019

T5原理-Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer -2019(待补充)

GPT-3原理-Language Models are Few-Shot Learners -2019(待补充)

【动态更新中】

相关推荐
笨鸟笃行3 分钟前
人工智能备考小结篇(后续会更新对应的题解)
人工智能
不当菜鸡的程序媛3 分钟前
Flow Matching|什么是“预测速度场 vt=ε−x”?
人工智能·算法·机器学习
kyle~8 分钟前
数学基础---四元数
人工智能·数学·机器人·旋转
PKNLP9 分钟前
14.大语言模型微调语料构建
人工智能·语言模型·模型微调
Wu Liuqi17 分钟前
【大模型学习4】大语言模型(LLM)详解
人工智能·学习·语言模型·大模型
SEOETC20 分钟前
AIGC|杭州AI优化企业新榜单与选择指南
人工智能·ai·aigc
学历真的很重要29 分钟前
LangChain V1.0 Messages 详细指南
开发语言·后端·语言模型·面试·langchain·职场发展·langgraph
sali-tec32 分钟前
C# 基于halcon的视觉工作流-章58-输出点云图
开发语言·人工智能·算法·计算机视觉·c#
小毅&Nora37 分钟前
【智能体】扣子平台 ① 构建智能体工作流:从提示词到JSON配置的全流程实践
人工智能
AI街潜水的八角1 小时前
深度学习十种食物分类系统1:数据集说明(含下载链接)
人工智能·深度学习·分类