😎Andrej Karpathy大模型讲解笔记,一起学习LLM大语言模型的原理

本文是对 Andrej Karpathy 在油管上发布的 Deep Dive into LLMs like ChatGPT 视频的学习笔记,原视频主要讲解了一个类似 ChatGPT 这样的 LLM 的实现路径

前训练阶段

预训练

获取大量高质量并且多样化的互联网文本数据

网络爬虫从互联网获取原始数据,并进加工

  • 滤掉涉黄或者暴力的网站地址
  • 提取 HTML 标签中的文本内容
  • 筛选出特定语言
  • 需要过滤掉各种个人隐私信息等。

Token化

将人类语言数据集转化成 token 供神经网络输入

Token化网站

神经网络训练

LLM学习 token 在序列中彼此跟随的统计关系,预测给定上下文后,下一个最有可能出现的 token

神经网络初始参数是随机的,预测也是随机的。 希望正确的token的概率更高, 可以通过计算损失函数来实现,并通过反向传播算法(backpropagation)来调整神经网络的参数。

  • 输入:模型从数据集中随机抽取固定长度的 token 窗口(例如 8000 个 token)

  • 输出: 预测下一个 token 的概率分布,词汇表中每个 token 都有一个概率值。

Transformer 架构

希望正确的token的概率更高, 可以通过计算损失函数来实现,并通过反向传播算法(backpropagation)来调整神经网络的参数。

LLM可视化

编码器

注意力机制

  • 模型处理某个词,会关注输入序列中所有的词

前馈神经网络

  • 自注意力 模块进一步处理
解码器
  • 接受 编码器 的输出与 已经生成文本的输出

  • 自注意力机制关注 前面的词

后训练阶段

监督微调

幻觉现象

  • AI 不会说不知道(概率模型)
  • 多次比较输出
  • 前往搜索 ,将内容加入全局上下文中

强化学习阶段

"DeepSeek"模型大量采用强化学习(RL),模型可以学习到"思维链"的认知模式

  • 语言模型可能会给出不同的解题方法,最终答案可能正确,实际复杂情形下,模型可能会给出错误的答案,强化导向正确结果的解决方案模式,这就是强化学习。
相关推荐
陈随易21 分钟前
2年没用Nodejs了,Bun很香
前端·后端·程序员
donecoding36 分钟前
Corepack 完全解析:从懵到懂,包管理器自由了
前端·node.js·前端工程化
yqcoder40 分钟前
端经典面试题:为什么 0.1 + 0.2 !== 0.3?
前端·css
ZC跨境爬虫1 小时前
跟着 MDN 学 HTML day_12:(HTML网页图片嵌入)
前端·javascript·css·ui·html
光影少年1 小时前
reeact虚拟DOM、Diff算法原理、key的作用与为什么不能用index
前端·react.js·掘金·金石计划
用户059540174461 小时前
大模型记忆存储踩坑实录:LangChain 的 ConversationBufferMemory 让我排查了 6 小时
前端·css
是上好佳佳佳呀1 小时前
【前端(十二)】JavaScript 函数与对象笔记
前端·javascript·笔记
你真的快乐吗1 小时前
@fuxishi/svg-icon:一个 Vue 3 svg本地图标+iconify图标组件库,让图标管理不再头疼
前端·vue.js·typescript
Rkgua1 小时前
ESModule和Commonjs模块的区别
前端·javascript
江南十四行1 小时前
ReAct Agent 基本理论与项目实战(二)
前端·react.js·前端框架