生成式大语言模型论文导读

远方的旅行者2024-04-05 13:50

当下，最火的人工智能无疑就是生成式大模型，包括纯大语言模型和多模态模型，所以本次也抱着学习的态度，以大模型发展的时间线来对主要节点的一些生成式语言模型的论文进行分享(论文和分享内容会动态更新)。

分享目录

transformer原理-Attention Is All You Need -2017（待补充）
GPT-1原理-Improving Language Understanding by Generative Pre-Training -2018
BERT原理-Pre-training of Deep Bidirectional Transformers for Language Understanding -2018
GPT-2原理-Language Models are Unsupervised Multitask Learners -2019

T5原理-Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer -2019（待补充）

GPT-3原理-Language Models are Few-Shot Learners -2019（待补充）

【动态更新中】

上一篇：【数据结构】排序算法

下一篇：前后端实现下拉框带条件查询（Vue+Java）

热门推荐

01两千字总结：Codex 国内如何安装和使用的教程，以及如何设置中文回答 02GitHub 镜像站点 03UV安装并设置国内源 04智能库存管理的需求预测模型：从业务痛点到落地代码的完整实践 0546个Nano-banana 精选提示词，持续更新中 06GitLab 零基础入门指南：从安装到项目管理全流程 07Linux下V2Ray安装配置指南 08一文了解国产算子编程语言 TileLang，TileLang 对国产开源生态的影响与启示 09jdk21下载、安装（Windows、Linux、macOS）10Cursor Plan Mode：AI 终于知道先想后做了