技术栈

raif

段智华
1 年前
llama3·raif·rhlf
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
1 年前
rlhf·llama3·raif
Llama模型家族之RLAIF 基于 AI 反馈的强化学习(三) RLAIF 的工作原理基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)