技术栈
raif
段智华
5 个月前
llama3
·
raif
·
rhlf
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(一)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
5 个月前
rlhf
·
llama3
·
raif
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(三) RLAIF 的工作原理
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)