技术栈

reward model

段智华
1 年前
llama3·reward model
Llama模型家族训练奖励模型Reward Model技术及代码实战(一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)