Transformer和LLM前沿内容(3):LLM Post-Training

视频链接:bilibili

文章目录

      • [1. LLM Fine-Tuning](#1. LLM Fine-Tuning)
        • [1.1 Supervised Fine-Tuning (SFT)](#1.1 Supervised Fine-Tuning (SFT))
        • [1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)](#1.2 Reinforcement Learning from Human Feedback (RLHF)(重点))
        • [1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)](#1.3 Parameter Efficient Fine-Tuning (PEFT)(重点))
          • [1.3.1 BitFit](#1.3.1 BitFit)
          • [1.3.2 TinyTL: Lite Residual Learning](#1.3.2 TinyTL: Lite Residual Learning)
          • [1.3.3 Adapter](#1.3.3 Adapter)
      • [2. Multi-modal LLMs](#2. Multi-modal LLMs)
        • [2.1 Cross-Attention Based: Flamingo](#2.1 Cross-Attention Based: Flamingo)
        • [2.2 Visual Tokens as Input: PaLM-E, VILA](#2.2 Visual Tokens as Input: PaLM-E, VILA)
        • [2.3 Enabling Visual Outputs: VILA-U](#2.3 Enabling Visual Outputs: VILA-U)
      • [3. Prompt Engineering](#3. Prompt Engineering)
        • [3.1 In-Context Learning (ICL)](#3.1 In-Context Learning (ICL))
        • [3.2 Chain-of-Thought (CoT)](#3.2 Chain-of-Thought (CoT))
        • [3.3 Retrieval Augmented Generation (RAG)](#3.3 Retrieval Augmented Generation (RAG))

1. LLM Fine-Tuning

1.1 Supervised Fine-Tuning (SFT)



1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)




1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)
1.3.1 BitFit
1.3.2 TinyTL: Lite Residual Learning
1.3.3 Adapter




2. Multi-modal LLMs

2.1 Cross-Attention Based: Flamingo

2.2 Visual Tokens as Input: PaLM-E, VILA

2.3 Enabling Visual Outputs: VILA-U

3. Prompt Engineering

3.1 In-Context Learning (ICL)

3.2 Chain-of-Thought (CoT)

3.3 Retrieval Augmented Generation (RAG)
相关推荐
格砸1 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云1 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8651 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔2 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung2 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_2 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安2 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计
掘金安东尼3 小时前
如何为 AI 编码代理配置 Next.js 项目
人工智能
aircrushin3 小时前
轻量化大模型架构演进
人工智能·架构
文心快码BaiduComate4 小时前
百度云与光本位签署战略合作:用AI Agent 重构芯片研发流程
前端·人工智能·架构