Transformer和LLM前沿内容(3):LLM Post-Training

视频链接:bilibili

文章目录

      • [1. LLM Fine-Tuning](#1. LLM Fine-Tuning)
        • [1.1 Supervised Fine-Tuning (SFT)](#1.1 Supervised Fine-Tuning (SFT))
        • [1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)](#1.2 Reinforcement Learning from Human Feedback (RLHF)(重点))
        • [1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)](#1.3 Parameter Efficient Fine-Tuning (PEFT)(重点))
          • [1.3.1 BitFit](#1.3.1 BitFit)
          • [1.3.2 TinyTL: Lite Residual Learning](#1.3.2 TinyTL: Lite Residual Learning)
          • [1.3.3 Adapter](#1.3.3 Adapter)
      • [2. Multi-modal LLMs](#2. Multi-modal LLMs)
        • [2.1 Cross-Attention Based: Flamingo](#2.1 Cross-Attention Based: Flamingo)
        • [2.2 Visual Tokens as Input: PaLM-E, VILA](#2.2 Visual Tokens as Input: PaLM-E, VILA)
        • [2.3 Enabling Visual Outputs: VILA-U](#2.3 Enabling Visual Outputs: VILA-U)
      • [3. Prompt Engineering](#3. Prompt Engineering)
        • [3.1 In-Context Learning (ICL)](#3.1 In-Context Learning (ICL))
        • [3.2 Chain-of-Thought (CoT)](#3.2 Chain-of-Thought (CoT))
        • [3.3 Retrieval Augmented Generation (RAG)](#3.3 Retrieval Augmented Generation (RAG))

1. LLM Fine-Tuning

1.1 Supervised Fine-Tuning (SFT)



1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)




1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)
1.3.1 BitFit
1.3.2 TinyTL: Lite Residual Learning
1.3.3 Adapter




2. Multi-modal LLMs

2.1 Cross-Attention Based: Flamingo

2.2 Visual Tokens as Input: PaLM-E, VILA

2.3 Enabling Visual Outputs: VILA-U

3. Prompt Engineering

3.1 In-Context Learning (ICL)

3.2 Chain-of-Thought (CoT)

3.3 Retrieval Augmented Generation (RAG)
相关推荐
马丁聊GEO1 天前
解码AI用户心智,筑牢可信GEO根基——悠易科技深度参与《中国AI用户态度与行为研究报告(2026)》发布会
人工智能·科技
nap-joker1 天前
Fusion - Mamba用于跨模态目标检测
人工智能·目标检测·计算机视觉·fusion-mamba·可见光-红外成像融合·远距离/伪目标问题
一只幸运猫.1 天前
2026Java 后端面试完整版|八股简答 + AI 大模型集成技术(最新趋势)
人工智能·面试·职场和发展
Promise微笑1 天前
2026年国产替代油介损测试仪:油介损全场景解决方案与技术演进
大数据·网络·人工智能
深海鱼在掘金1 天前
深入浅出 LangChain —— 第三章:模型抽象层
人工智能·langchain·agent
生信碱移1 天前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
workflower1 天前
具身智能行业应用-生活服务业
大数据·人工智能·机器人·动态规划·生活
GitCode官方1 天前
基于昇腾 MindSpeed LLM 玩转 DeepSeekV4-Flash 模型的预训练复现部署
人工智能·开源·atomgit
大刘讲IT1 天前
AI重塑企业信息价值标准:从“系统供给”到“用户定义”的企业数字化新范式
人工智能·经验分享·ai·制造
流年似水~1 天前
MCP协议实战:从零搭建一个让Claude能“看见“数据库的工具服务
数据库·人工智能·程序人生·ai·ai编程