Transformer和LLM前沿内容(3):LLM Post-Training

视频链接:bilibili

文章目录

      • [1. LLM Fine-Tuning](#1. LLM Fine-Tuning)
        • [1.1 Supervised Fine-Tuning (SFT)](#1.1 Supervised Fine-Tuning (SFT))
        • [1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)](#1.2 Reinforcement Learning from Human Feedback (RLHF)(重点))
        • [1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)](#1.3 Parameter Efficient Fine-Tuning (PEFT)(重点))
          • [1.3.1 BitFit](#1.3.1 BitFit)
          • [1.3.2 TinyTL: Lite Residual Learning](#1.3.2 TinyTL: Lite Residual Learning)
          • [1.3.3 Adapter](#1.3.3 Adapter)
      • [2. Multi-modal LLMs](#2. Multi-modal LLMs)
        • [2.1 Cross-Attention Based: Flamingo](#2.1 Cross-Attention Based: Flamingo)
        • [2.2 Visual Tokens as Input: PaLM-E, VILA](#2.2 Visual Tokens as Input: PaLM-E, VILA)
        • [2.3 Enabling Visual Outputs: VILA-U](#2.3 Enabling Visual Outputs: VILA-U)
      • [3. Prompt Engineering](#3. Prompt Engineering)
        • [3.1 In-Context Learning (ICL)](#3.1 In-Context Learning (ICL))
        • [3.2 Chain-of-Thought (CoT)](#3.2 Chain-of-Thought (CoT))
        • [3.3 Retrieval Augmented Generation (RAG)](#3.3 Retrieval Augmented Generation (RAG))

1. LLM Fine-Tuning

1.1 Supervised Fine-Tuning (SFT)



1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)




1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)
1.3.1 BitFit
1.3.2 TinyTL: Lite Residual Learning
1.3.3 Adapter




2. Multi-modal LLMs

2.1 Cross-Attention Based: Flamingo

2.2 Visual Tokens as Input: PaLM-E, VILA

2.3 Enabling Visual Outputs: VILA-U

3. Prompt Engineering

3.1 In-Context Learning (ICL)

3.2 Chain-of-Thought (CoT)

3.3 Retrieval Augmented Generation (RAG)
相关推荐
梦想的初衷~几秒前
claude code、codex双AI协同高水平论文撰写与质量校准:数据分析→论文初稿→交叉审稿全流程
人工智能·生物信息·实战教程·临床医学·claude code·codex cli·认知颠覆
@蔓蔓喜欢你几秒前
GraphQL 入门:API 开发的新范式
人工智能·ai
Omics Pro1 分钟前
免费!糖蛋白质组学数据分析
开发语言·深度学习·数据挖掘·数据分析·r语言·excel·知识图谱
南屹川3 分钟前
【架构设计】设计模式实战与应用:从理论到代码实现
人工智能
梦想的颜色3 分钟前
LangGraph与智能体:当AI学会了“思考图谱”,离真正干活还有多远?
人工智能
MediaTea6 分钟前
DL:深度学习的主要任务
人工智能·深度学习
南屹川6 分钟前
【测试】自动化测试实战:从单元测试到端到端测试
人工智能
han_8 分钟前
手把手教你写一个 AI Skill,让 AI 真正学会你的工作流
人工智能·ai编程·claude
蔡俊锋8 分钟前
AI广告投放Agent:从Demo到实战的半年进化
人工智能·ai广告投放agent
莱歌数字11 分钟前
AR眼镜分区散热方案:让SoC“冷”下来,让光学“稳”住
人工智能·科技·电脑·ar·制造·散热