大模型学习笔记 - 大纲

LLM 大纲

  • [LLM 大纲](#LLM 大纲)
    • [1. LLM 模型架构](#1. LLM 模型架构)
      • [LLM 技术细节 - 注意力机制](#LLM 技术细节 - 注意力机制)
      • [LLM 技术细节 - 位置编码](#LLM 技术细节 - 位置编码)
    • [2. LLM 预训练](#2. LLM 预训练)
    • [3. LLM 指令微调](#3. LLM 指令微调)
      • [LLM 高效微调技术](#LLM 高效微调技术)
    • [4. LLM 人类对齐](#4. LLM 人类对齐)
      • [LLM InstructGPT](#LLM InstructGPT)
      • [LLM PPO算法](#LLM PPO算法)
      • [LLM DPO 算法](#LLM DPO 算法)
    • [5. LLM 解码与部署](#5. LLM 解码与部署)
    • [6. LLM 模型LLaMA 系列](#6. LLM 模型LLaMA 系列)
    • [7. LLM RAG](#7. LLM RAG)

1. LLM 模型架构

大模型学习笔记 - LLM模型架构

LLM 技术细节 - 注意力机制

To Be added

LLM 技术细节 - 位置编码

To Be added

2. LLM 预训练

大模型学习笔记 - LLM 预训练

3. LLM 指令微调

大模型学习笔记 - LLM指令微调

LLM 高效微调技术

TO Be Added

4. LLM 人类对齐

大模型学习笔记 - LLM 之RLHF人类对齐的简单总结

LLM InstructGPT

大模型学习笔记 - InstructGPT中的微调与对齐

LLM PPO算法

To Be added

LLM DPO 算法

To Be added

5. LLM 解码与部署

大模型学习笔记 - LLM 解码与部署

6. LLM 模型LLaMA 系列

To Be added

7. LLM RAG

To Be added

相关推荐
●VON10 分钟前
重生之我在大学自学鸿蒙开发第五天-《实战篇》
学习·华为·云原生·harmonyos·鸿蒙
QiZhang | UESTC13 分钟前
学习日记day
学习
Juchecar28 分钟前
给AI装上“手脚”:大模型如何自动执行复杂任务?
人工智能
长鸳词羡38 分钟前
LoRA微调
人工智能·深度学习·机器学习
jerryinwuhan1 小时前
Transformer ViT 架构(转载)
人工智能·深度学习·transformer
码农阿豪1 小时前
【征文计划】码上分享:基于 Rokid CXR-M SDK 构建「AI远程协作助手」实战全记录
人工智能·kotlin·sdk·rokid
mahuan1688881 小时前
ITVDesk
人工智能
聚梦小课堂1 小时前
用于大语言模型后训练阶段的新方法GVPO(Group Variance Policy Optimization)
人工智能·语言模型·后训练
说私域1 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的互联网运营体系化研究
人工智能·小程序
谢栋_2 小时前
基于 GitLab CI/CD 与 Google Gemini 的 AI Code Review 自动化方案
人工智能·ci/cd·gitlab