技术栈
instructgpt
SpikeKing
3 个月前
人工智能
·
深度学习
·
语言模型
·
rlhf
·
alignment
·
dpo
·
instructgpt
LLM - 理解 多模态大语言模型(MLLM) 的 对齐微调(Alignment) 与相关技术 (五)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142354652
JL_Jessie
5 个月前
gpt
·
llm
·
instructgpt
大模型学习笔记 - InstructGPT中的微调与对齐
LLM 我们不一定要预训练模型,但是一定要会微调。InstructGPT更是微调的最经典的文章。这里详细介绍InstructGPT的微调技术。