模型推理、调用常用参数解释(temperature、top_k、top_p)

温度( temperature)影响词选择的随机性:较高的温度会增加选择不太可能词的概率,从而提高文本的多样性。较低的温度使模型的选择更加可预测。

top_k 参数将模型的选择限制为最可能的 k 个下一个 token。当 top_k 设置为 1 时,模型会选择最有可能的 token,在这种情况下,给定完全相同的提示词,其输出始终相同。我们称此为贪婪解码。当 top_k 设置为大于 1 时,模型可以考虑多个可能的下一个 token,而不仅仅是它评估为最可能的那个。当 top_k 设置为 1 时,temperature 参数没有影响;然而,当 top_k 大于 1 时,我们还可以传入一个介于 0.0 和 1.0 之间的值作为模型的 temperature。例如,当 top_k 设置为 2 时,模型从两个最可能的下一个标记中进行选择。随着温度升高,概率分布变得更加均匀,使得第二大概率的 token 被选中的机会更大;而较低的温度则使模型更倾向于在两个选项中选择最可能的 token。

在语言模型的文本生成背景下,top_p(也称为"核采样")涉及选择一组可能的下一个标记,其累积概率略高于由 top_p 指定的阈值,该值为 0.0 到 1.0 之间的浮点数。其工作原理如下:

1、模型计算每个可能的下一个 token 的概率,并按降序排列。

2、从最可能的 token 开始,逐步将标记加入子集,直到它们的概率总和超过 top_p 阈值。

3、然后模型仅从这个子集中随机选择下一个 token。

相关推荐
nix.gnehc20 小时前
大模型全流程入门解析——从理论基础到推理落地
llm·推理·vllm·sglang
小白狮ww9 天前
Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled 蒸馏模型,27B 参数也能做强推理
人工智能·自然语言处理·claude·通义千问·opus·推理·qwen3.5
一颗小树x14 天前
《VLA 系列》复现 Ψ₀ | Psi0 | 通用人形机器人 | 移动操作模型
机器人·微调训练·推理·复现·psi0
大数据AI人工智能培训专家培训讲师叶梓1 个月前
120B 数学语料 + GRPO 算法,DeepSeekMath 刷新开源大模型推理天花板
人工智能·算法·大模型·推理·deepseek·openclaw·openclaw 讲师
小北的AI科技分享2 个月前
GPU服务器租用:从重资产到轻运营的算力变革
推理··
小北的AI科技分享2 个月前
国内边缘算力平台已整合超2000P资源
推理··
小北的AI科技分享2 个月前
免费大模型API服务现状与技术指标深度解析
应用·模型·推理
小北的AI科技分享2 个月前
大模型调用平台:架构原理与选型全解析
模型·调用·推理
小北的AI科技分享2 个月前
大模型API调用指南:技术原理与实践测评
架构·模型·推理