生成式大语言模型论文导读

当下,最火的人工智能无疑就是生成式大模型,包括纯大语言模型和多模态模型,所以本次也抱着学习的态度,以大模型发展的时间线来对主要节点的一些生成式语言模型的论文进行分享(论文和分享内容会动态更新)。

分享目录

transformer原理-Attention Is All You Need -2017(待补充)
GPT-1原理-Improving Language Understanding by Generative Pre-Training -2018
BERT原理-Pre-training of Deep Bidirectional Transformers for Language Understanding -2018
GPT-2原理-Language Models are Unsupervised Multitask Learners -2019

T5原理-Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer -2019(待补充)

GPT-3原理-Language Models are Few-Shot Learners -2019(待补充)

【动态更新中】

相关推荐
roman_日积跬步-终至千里6 小时前
机器学习知识架构概览
人工智能·机器学习
Elastic 中国社区官方博客7 小时前
Elastic 与 Accenture 在 GenAI 数据准备方面的合作
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·aws
技术传感器7 小时前
模型微调实战方法论:用5%的成本,获得80%的专用性能——中小企业专属模型锻造术
人工智能·架构·aigc
夕小瑶7 小时前
阿里千问 APP 来了,对标 ChatGPT,配吗?
人工智能
Jwest20217 小时前
工控一体机在真空灌封机中的应用
人工智能
LinkTime_Cloud7 小时前
OpenAI 拉响红色警报,以突击式提升 ChatGPT
人工智能·chatgpt
QT 小鲜肉7 小时前
【孙子兵法之中篇】007. 孙子兵法·军争篇深度解析与现代应用
人工智能·笔记·读书·孙子兵法
花花Binki7 小时前
AI 编程处于哪个阶段了?TRAE SOLO给出了『它』的答案
人工智能
静Yu7 小时前
CANN在半导体制造中的创新应用:多模态缺陷检测与动态批处理优化
人工智能·制造·cann
Python大数据分析@7 小时前
通过 MCP 实现 AI Agent 目前有哪些最佳实践?
人工智能