Transformer和LLM前沿内容（3）：LLM Post-Training

自动驾驶小学生2026-01-05 17:20

视频链接：bilibili

文章目录

- - [1. LLM Fine-Tuning](#1. LLM Fine-Tuning)
  - - [1.1 Supervised Fine-Tuning (SFT)](#1.1 Supervised Fine-Tuning (SFT))
    - [1.2 Reinforcement Learning from Human Feedback (RLHF)（重点）](#1.2 Reinforcement Learning from Human Feedback (RLHF)（重点）)
    - [1.3 Parameter Efficient Fine-Tuning (PEFT)（重点）](#1.3 Parameter Efficient Fine-Tuning (PEFT)（重点）)
    - - [1.3.1 BitFit](#1.3.1 BitFit)
      - [1.3.2 TinyTL: Lite Residual Learning](#1.3.2 TinyTL: Lite Residual Learning)
      - [1.3.3 Adapter](#1.3.3 Adapter)
  - [2. Multi-modal LLMs](#2. Multi-modal LLMs)
  - - [2.1 Cross-Attention Based: Flamingo](#2.1 Cross-Attention Based: Flamingo)
    - [2.2 Visual Tokens as Input: PaLM-E, VILA](#2.2 Visual Tokens as Input: PaLM-E, VILA)
    - [2.3 Enabling Visual Outputs: VILA-U](#2.3 Enabling Visual Outputs: VILA-U)
  - [3. Prompt Engineering](#3. Prompt Engineering)
  - - [3.1 In-Context Learning (ICL)](#3.1 In-Context Learning (ICL))
    - [3.2 Chain-of-Thought (CoT)](#3.2 Chain-of-Thought (CoT))
    - [3.3 Retrieval Augmented Generation (RAG)](#3.3 Retrieval Augmented Generation (RAG))

1. LLM Fine-Tuning

1.1 Supervised Fine-Tuning (SFT)

1.2 Reinforcement Learning from Human Feedback (RLHF)（重点）

1.3 Parameter Efficient Fine-Tuning (PEFT)（重点）

1.3.1 BitFit

1.3.2 TinyTL: Lite Residual Learning

1.3.3 Adapter

2.1 Cross-Attention Based: Flamingo

2.2 Visual Tokens as Input: PaLM-E, VILA

2.3 Enabling Visual Outputs: VILA-U

3. Prompt Engineering

3.1 In-Context Learning (ICL)

3.2 Chain-of-Thought (CoT)

3.3 Retrieval Augmented Generation (RAG)

上一篇：基于单片机的自动路灯监控系统设计

下一篇：从重复计算到无效渲染：用对 useMemo 和 useCallback 提升 React 性能

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06OpenClaw优化飞书API 额度已耗尽问题 07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08OpenClaw大龙虾机器人完整安装教程 09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw 接入阿里云百炼 Coding Plan 指南