技术栈
reward model
段智华
6 个月前
llama3
·
reward model
Llama模型家族训练奖励模型Reward Model技术及代码实战(一)
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)