大模型学习笔记 - 大纲

LLM 大纲

  • [LLM 大纲](#LLM 大纲)
    • [1. LLM 模型架构](#1. LLM 模型架构)
      • [LLM 技术细节 - 注意力机制](#LLM 技术细节 - 注意力机制)
      • [LLM 技术细节 - 位置编码](#LLM 技术细节 - 位置编码)
    • [2. LLM 预训练](#2. LLM 预训练)
    • [3. LLM 指令微调](#3. LLM 指令微调)
      • [LLM 高效微调技术](#LLM 高效微调技术)
    • [4. LLM 人类对齐](#4. LLM 人类对齐)
      • [LLM InstructGPT](#LLM InstructGPT)
      • [LLM PPO算法](#LLM PPO算法)
      • [LLM DPO 算法](#LLM DPO 算法)
    • [5. LLM 解码与部署](#5. LLM 解码与部署)
    • [6. LLM 模型LLaMA 系列](#6. LLM 模型LLaMA 系列)
    • [7. LLM RAG](#7. LLM RAG)

1. LLM 模型架构

大模型学习笔记 - LLM模型架构

LLM 技术细节 - 注意力机制

To Be added

LLM 技术细节 - 位置编码

To Be added

2. LLM 预训练

大模型学习笔记 - LLM 预训练

3. LLM 指令微调

大模型学习笔记 - LLM指令微调

LLM 高效微调技术

TO Be Added

4. LLM 人类对齐

大模型学习笔记 - LLM 之RLHF人类对齐的简单总结

LLM InstructGPT

大模型学习笔记 - InstructGPT中的微调与对齐

LLM PPO算法

To Be added

LLM DPO 算法

To Be added

5. LLM 解码与部署

大模型学习笔记 - LLM 解码与部署

6. LLM 模型LLaMA 系列

To Be added

7. LLM RAG

To Be added

相关推荐
6230_11 分钟前
关于HTTP通讯流程知识点补充—常见状态码及常见请求方式
前端·javascript·网络·网络协议·学习·http·html
醉后才知酒浓11 分钟前
图像处理之蒸馏
图像处理·人工智能·深度学习·计算机视觉
Pandaconda37 分钟前
【C++ 面试 - 新特性】每日 3 题(六)
开发语言·c++·经验分享·笔记·后端·面试·职场和发展
炸弹气旋1 小时前
基于CNN卷积神经网络迁移学习的图像识别实现
人工智能·深度学习·神经网络·计算机视觉·cnn·自动驾驶·迁移学习
python_知世1 小时前
时下改变AI的6大NLP语言模型
人工智能·深度学习·自然语言处理·nlp·大语言模型·ai大模型·大模型应用
愤怒的可乐1 小时前
Sentence-BERT实现文本匹配【CoSENT损失】
人工智能·深度学习·bert
冻感糕人~1 小时前
HRGraph: 利用大型语言模型(LLMs)构建基于信息传播的HR数据知识图谱与职位推荐
人工智能·深度学习·自然语言处理·知识图谱·ai大模型·llms·大模型应用
花生糖@1 小时前
Midjourney即将推出的AI生视频产品:CEO洞见分享
人工智能·ai·aigc·midjourney
小言从不摸鱼1 小时前
【NLP自然语言处理】文本处理的基本方法
人工智能·python·自然语言处理
手打猪大屁1 小时前
STM32——串口通信(发送/接收数据与中断函数应用)
经验分享·笔记·stm32·单片机·嵌入式硬件