技术栈

reject sample

段智华
1 年前
llama3·reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(五)蒙特卡罗算法在拒绝抽样中:均匀分布与样本接受标准基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
1 年前
llama3·reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(九) 强化学习之Rejection Sampling基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
1 年前
llama3·reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(二)均匀分布简介基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)