大模型学习笔记 - LLM 之 LLaMA系列(待更新)

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models

Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)

LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

  1. pre-normalization. RSMNorm。
  2. SwiGLU activation function [PaLM].
  3. Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
  4. FlashAttention

LLaMA-2

涉及到的基础知识点:

  1. groupAttention
  2. RLHF(PPO,拒绝采样)

LLama2:

我们还将预训练语料库的大小增加了 40%,增加了模型的上下文长度,并采用分组查询注意力(Ainslie et al., 2023)。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:

Llama 2-Chat 的训练:这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来,我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后,使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型,特别是通过拒绝采样近端策略优化 (PPO)。在 RLHF 阶段,迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

LLaMA-3

相关推荐
瑶光守护者1 分钟前
【学习笔记】Ku终端本振同源频偏分析与上行中频补偿计算报告
笔记·学习
Westward-sun.3 分钟前
uv入门笔记
笔记·uv
thisbrand4 分钟前
李辉《曾国藩日记》笔记:拖延死和急进死!
笔记·曾国藩
Hello_Embed29 分钟前
libmodbus 移植到 STM32H5
笔记·stm32·单片机·嵌入式硬件·嵌入式·ai编程
南境十里·墨染春水35 分钟前
线程池学习(二)线程池理解
java·jvm·学习
Biocloudy42 分钟前
循环肿瘤细胞的分离和分型技术
人工智能·经验分享·笔记·其他
aaaak_1 小时前
PDD 直播间 评论 , wss hex Protobuf 解析流程分析学习
java·前端·学习
东风破1371 小时前
DM8达梦分布式计算数据库集群DPC安装部署学习记录
数据库·学习
Undergoer_TW1 小时前
【SLAM性能评估笔记】公开的Vo性能评估工具调研与局限性分析
笔记·evo·kitti·vo·性能评估·tum
空太Jun1 小时前
Git 使用学习笔记
笔记·git·学习