大语言模型入门文献推荐

分享一些入门大模型时候学习过的文献。分成两类:大模型微调论文、基础大模型论文。这些论文不用精通,明白其基本原理即可。目前技术发展太快,更多的时间和精力应该放在前沿论文的学习上。

一、基础大模型论文

首先是目前主流的一些模型,包括GPT(Openai), GLM(清华)Llama(Meta)。相关的大模型论文还有很多,例如Qwen等。读者能就其中的论文做到举一反三即可。

  1. GPT1: Improving language understanding by generative pre-training
  2. GPT2: Language models are unsupervised multitask learners
  3. **GPT-3:**Language Models are Few-Shot Learners
  4. GPT-4 Technical Report
  5. InstructGPT: Training language models to follow instructions with human feedback
  6. **GLM:**General Language Model Pretraining with Autoregressive Blank Infilling
  7. **GLM-130B:**An Open Bilingual Pre-trained Model
  8. **LLaMA:**Open and Efficient Foundation Language Models
  9. Llama 2: Open Foundation and Fine-Tuned Chat Model

还有一些经典的文本生成论文,大家有时间也可以阅读。

  1. BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension
  2. **T5:**Exploring the limits of transfer learning with a unified text-to-text transformer
  3. **ELMO:**Deep contextualized word representations

二、微调方法论文

有关大模型微调方法,目前LoRA几乎是垄断的情况,调起来也非常简单。所以其他微调方法了解即可。

  1. Prefix-Tuning: Optimizing Continuous Prompts for Generation
  2. P-tuning: GPT Understands, Too
  3. **P-Tuning V2:**Prompt Tuning Can Be Comparable to Fine-tuning Across Scales and Tasks
  4. **Prompt tuning:**The Power of Scale for Parameter-Efficient Prompt Tuning
  5. Adapter: Parameter-Efficient Transfer Learning for NLP
  6. **LORA:**LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

此外也有一些写的很好的微调方法综述文章。

  1. Towards a unified view of parameter-efficient transfer learning
  2. Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models
  3. Scaling down to scale up: A guide to parameter-efficient fine-tuning
  4. UniPELT: A Unified Framework for Parameter-Efficient Language Model Tuning

刚学习的时候,经常会听到指令微调(Instruction tuning),有监督微调(supervised finetuning等),其实都是一回事,这边也放一些相关文章。

  1. Instruction Tuning for Large Language Models: A Survey
  2. Instruct learning: Finetuned Language Models are Zero-shot Learners

三、其他资料

1、P-tuning:自动构建模版,释放语言模型潜能

2、PET,必须要GPT3吗?不,BERT的MLM模型也能小样本学习

相关推荐
爱看科技2 分钟前
XR入口争夺战白热化,高通/谷歌/WIMI微美全息正扩张加速跑马圈地AI眼镜!
人工智能·xr
renhongxia14 分钟前
世界模型作为AGI落地底层底座的作用
人工智能·深度学习·生成对抗网络·自然语言处理·知识图谱·agi
落叶无情4 分钟前
ICEF 认知操作系统・CUS-L0-A 十大元认知原则(正式定稿 V1.0)
人工智能
胖咕噜的稞达鸭8 分钟前
如何写好一个skill
人工智能·数码相机
Inhand陈工13 分钟前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
计算机科研狗@OUC14 分钟前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
大鱼>14 分钟前
大语言模型+物联网:LLM理解物理世界
物联网·struts·语言模型·多模态·aiot
code_pgf16 分钟前
端到端自动驾驶 BEV stack
人工智能·机器学习·自动驾驶
wy31362282119 分钟前
AI——移动端大模型部署新范式:基于sherpa-onnx的Android离线语音识别实战(语音转文字)
人工智能
果丁智能22 分钟前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居