大模型学习笔记 - LLM 之 LLaMA系列(待更新)

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models

Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)

LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

  1. pre-normalization. RSMNorm。
  2. SwiGLU activation function [PaLM].
  3. Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
  4. FlashAttention

LLaMA-2

涉及到的基础知识点:

  1. groupAttention
  2. RLHF(PPO,拒绝采样)

LLama2:

我们还将预训练语料库的大小增加了 40%,增加了模型的上下文长度,并采用分组查询注意力(Ainslie et al., 2023)。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:

Llama 2-Chat 的训练:这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来,我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后,使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型,特别是通过拒绝采样近端策略优化 (PPO)。在 RLHF 阶段,迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

LLaMA-3

相关推荐
future14129 小时前
MCU硬件学习
单片机·嵌入式硬件·学习
好奇龙猫9 小时前
日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(4):文法運用
学习
mtactor9 小时前
投资理财学习笔记
笔记·学习·金融
浮游本尊10 小时前
React 18.x 学习计划 - 第四天:React Hooks深入
前端·学习·react.js
立志成为大牛的小牛11 小时前
数据结构——二十六、邻接表(王道408)
开发语言·数据结构·c++·学习·程序人生
XiangrongZ11 小时前
江协科技STM32课程笔记(五)— ADC模数转换器
笔记·科技·stm32
Olrookie12 小时前
若依前后端分离版学习笔记(二十)——实现滑块验证码(vue3)
java·前端·笔记·后端·学习·vue·ruoyi
请你喝好果汁64112 小时前
Conda_bashrc 初始化机制学习笔记
笔记·学习·conda
maxruan13 小时前
PyTorch学习
人工智能·pytorch·python·学习
MYX_30913 小时前
第三章 线型神经网络
深度学习·神经网络·学习·算法