大模型学习笔记 - LLM 之 LLaMA系列(待更新)

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models

Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)

LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

  1. pre-normalization. RSMNorm。
  2. SwiGLU activation function [PaLM].
  3. Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
  4. FlashAttention

LLaMA-2

涉及到的基础知识点:

  1. groupAttention
  2. RLHF(PPO,拒绝采样)

LLama2:

我们还将预训练语料库的大小增加了 40%,增加了模型的上下文长度,并采用分组查询注意力(Ainslie et al., 2023)。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:

Llama 2-Chat 的训练:这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来,我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后,使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型,特别是通过拒绝采样近端策略优化 (PPO)。在 RLHF 阶段,迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

LLaMA-3

相关推荐
.千余16 分钟前
【Linux】开发工具1
linux·运维·服务器·c语言·学习
中屹指纹浏览器19 分钟前
跨终端跨平台指纹浏览器的环境一致性技术架构与落地实践
经验分享·笔记
爱上好庆祝23 分钟前
学习js第一天(出发新世界)
开发语言·前端·javascript·css·学习·html·ecmascript
码农的小菜园44 分钟前
Android的Locale学习笔记
android·笔记·学习
zhangrelay1 小时前
Lubuntu 26.04移动系统使用配置测试记录与引导修复备注
笔记·学习
摇曳的精灵1 小时前
OceanBase学习
学习·oceanbase
jy022688791 小时前
线性代数-笔记
笔记·线性代数
liurendonews1 小时前
刘韧微积分笔记之四:手机里的微积分
笔记·智能手机
星幻元宇VR1 小时前
VR消防安全学习机,数字化消防培训新选择
科技·学习·安全·vr
光影少年1 小时前
高级前端需要学习那些东西?
前端·人工智能·学习·aigc·ai编程