技术栈

instructgpt

SpikeKing
8 个月前
人工智能·深度学习·语言模型·rlhf·alignment·dpo·instructgpt
LLM - 理解 多模态大语言模型(MLLM) 的 对齐微调(Alignment) 与相关技术 (五)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142354652
JL_Jessie
9 个月前
gpt·llm·instructgpt
大模型学习笔记 - InstructGPT中的微调与对齐LLM 我们不一定要预训练模型,但是一定要会微调。InstructGPT更是微调的最经典的文章。这里详细介绍InstructGPT的微调技术。