技术栈

推理优化

山顶夕景
3 个月前
大模型·llm·sft·拒绝采样微调·推理优化
【LLM】为何DeepSeek 弃用MST却采用Rejection采样在提升大语言模型(LLM)推理能力时,拒绝采样(Rejection Sampling)和 马尔可夫搜索树(Markov Search Tree)是两个超强的技术。