Top-p采样：解锁语言模型的创意之门

ZhangJiQun&MXP2025-05-16 8:23

Top - p采样是什么：核采样：排序，累计到0.7，随机选择

在自然语言生成和大规模语言模型推理中，Top - p采样（又叫核采样，Nucleus Sampling）是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值，取值范围是0到1。它表示在生成文本时，从概率分布中选择累计概率大于或等于p的最小词集 ，然后从这个词集中随机选择一个词作为输出。

例如，如果p = 0.7，那么模型会从概率分布中选出累计概率达到0.7的那些词，然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词，生成的文本更可预测和重复；较高的p值则会让模型考虑更大的词集，生成的文本更多样和有创意。

原理：排序，累计到0.7，随机选择

概率排序与累积 ：模型在生成每个词时，会先对词汇表中的所有词计算一个概率分布（通常通过Softmax函数得到） 。将这些词按照概率从核采样，然后依次累加这些词的概率，直到累加的概率大于或等于设定的p值为止 ，此时所包含的词就构成了用于采样的候选词集。
随机采样 ：从得到的候选词集中，按照它们各自的概率进行随机采样，选择其中一个词作为生成的结果。

上一篇：GPT（ Generative Pre-trained Transformer ）模型：基于Transformer

下一篇：【NLP 72、Prompt、Agent、MCP、function calling】

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06OpenClaw优化飞书API 额度已耗尽问题 07Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 08Window 10部署openclaw报错node.exe : npm error code 128 09OpenClaw大龙虾机器人完整安装教程 10小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）