技术栈
拒绝采样微调
山顶夕景
8 小时前
大模型
·
llm
·
sft
·
拒绝采样微调
·
推理优化
【LLM】为何DeepSeek 弃用MST却采用Rejection采样
在提升大语言模型(LLM)推理能力时,拒绝采样(Rejection Sampling)和 马尔可夫搜索树(Markov Search Tree)是两个超强的技术。