Transformer和LLM前沿内容(3):LLM Post-Training

视频链接:bilibili

文章目录

      • [1. LLM Fine-Tuning](#1. LLM Fine-Tuning)
        • [1.1 Supervised Fine-Tuning (SFT)](#1.1 Supervised Fine-Tuning (SFT))
        • [1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)](#1.2 Reinforcement Learning from Human Feedback (RLHF)(重点))
        • [1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)](#1.3 Parameter Efficient Fine-Tuning (PEFT)(重点))
          • [1.3.1 BitFit](#1.3.1 BitFit)
          • [1.3.2 TinyTL: Lite Residual Learning](#1.3.2 TinyTL: Lite Residual Learning)
          • [1.3.3 Adapter](#1.3.3 Adapter)
      • [2. Multi-modal LLMs](#2. Multi-modal LLMs)
        • [2.1 Cross-Attention Based: Flamingo](#2.1 Cross-Attention Based: Flamingo)
        • [2.2 Visual Tokens as Input: PaLM-E, VILA](#2.2 Visual Tokens as Input: PaLM-E, VILA)
        • [2.3 Enabling Visual Outputs: VILA-U](#2.3 Enabling Visual Outputs: VILA-U)
      • [3. Prompt Engineering](#3. Prompt Engineering)
        • [3.1 In-Context Learning (ICL)](#3.1 In-Context Learning (ICL))
        • [3.2 Chain-of-Thought (CoT)](#3.2 Chain-of-Thought (CoT))
        • [3.3 Retrieval Augmented Generation (RAG)](#3.3 Retrieval Augmented Generation (RAG))

1. LLM Fine-Tuning

1.1 Supervised Fine-Tuning (SFT)



1.2 Reinforcement Learning from Human Feedback (RLHF)(重点)




1.3 Parameter Efficient Fine-Tuning (PEFT)(重点)
1.3.1 BitFit
1.3.2 TinyTL: Lite Residual Learning
1.3.3 Adapter




2. Multi-modal LLMs

2.1 Cross-Attention Based: Flamingo

2.2 Visual Tokens as Input: PaLM-E, VILA

2.3 Enabling Visual Outputs: VILA-U

3. Prompt Engineering

3.1 In-Context Learning (ICL)

3.2 Chain-of-Thought (CoT)

3.3 Retrieval Augmented Generation (RAG)
相关推荐
美酒没故事°1 天前
Open WebUI安装指南。搭建自己的自托管 AI 平台
人工智能·windows·ai
云烟成雨TD1 天前
Spring AI Alibaba 1.x 系列【6】ReactAgent 同步执行 & 流式执行
java·人工智能·spring
简简单单做算法1 天前
基于GA遗传优化的Transformer-LSTM网络模型的时间序列预测算法matlab性能仿真
深度学习·matlab·lstm·transformer·时间序列预测·ga遗传优化·电池剩余寿命预测
AI攻城狮1 天前
用 Obsidian CLI + LLM 构建本地 RAG:让你的笔记真正「活」起来
人工智能·云原生·aigc
鸿乃江边鸟1 天前
Nanobot 从onboard启动命令来看个人助理Agent的实现
人工智能·ai
lpfasd1231 天前
基于Cloudflare生态的应用部署与开发全解
人工智能·agent·cloudflare
俞凡1 天前
DevOps 2.0:智能体如何接管故障修复和基础设施维护
人工智能
comedate1 天前
[OpenClaw] GLM 5 关于电影 - 人工智能 - 的思考
人工智能·电影评价
财迅通Ai1 天前
6000万吨产能承压 卫星化学迎来战略窗口期
大数据·人工智能·物联网·卫星化学
liliangcsdn1 天前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索