技术栈
reject sample
段智华
5 个月前
llama3
·
reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(五)蒙特卡罗算法在拒绝抽样中:均匀分布与样本接受标准
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
5 个月前
llama3
·
reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(九) 强化学习之Rejection Sampling
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)
段智华
5 个月前
llama3
·
reject sample
Llama模型家族之拒绝抽样(Rejection Sampling)(二)均匀分布简介
基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一)基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)