Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集 ,然后从这个词集中随机选择一个词作为输出。

例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积 :模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到) 。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止 ,此时所包含的词就构成了用于采样的候选词集
  • 随机采样 :从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
相关推荐
叶子Talk10 分钟前
GPT-Image-2正式发布:文字渲染99%,Image Arena三项第一,AI图像生成彻底变天了
人工智能·gpt·计算机视觉·ai·openai·图像生成·gpt-image-2
uncle_ll10 分钟前
LangChain基础学习笔记
笔记·学习·langchain·llm·rag
不知名的老吴11 分钟前
逆转训练针对大语言模型逆转训练的重要性
人工智能·深度学习·语言模型
pingao14137813 分钟前
智联未来:4G温湿度传感器如何重塑数据监测新生.态
大数据·网络·人工智能
Thanwind26 分钟前
从0开始的机器学习之旅(二):监督学习,从线性回归说起
学习·机器学习·线性回归
程序媛小鱼29 分钟前
《All in RAG》学习笔记
人工智能
菜鸟‍30 分钟前
【CVPR 2026】LitePT:更轻、更强的点云 Transformer【论文学习】
深度学习·学习·transformer
weixin_4462608534 分钟前
2026年IT技术趋势预测:从AIGC的狂热到Agent生态的底层重塑
人工智能·aigc
LaughingZhu35 分钟前
Product Hunt 每日热榜 | 2026-04-24
人工智能·经验分享·深度学习·神经网络·产品运营
AI医影跨模态组学37 分钟前
如何将CT影像组学与深度学习特征与肝细胞癌的缺氧-免疫抑制-代谢重编程恶性微环境关联,进一步解释与TACE预后及肿瘤生物学行为的机制联系
人工智能·深度学习·论文·医学·医学影像