Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集 ,然后从这个词集中随机选择一个词作为输出。

例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积 :模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到) 。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止 ,此时所包含的词就构成了用于采样的候选词集
  • 随机采样 :从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
相关推荐
freepopo几秒前
天津商业空间设计:本地团队的美学落地方案 [特殊字符]
大数据·人工智能·python
想你依然心痛3 分钟前
AI 视频生成新时代:Wan2.2-T2V-A5B 文本转视频实战
人工智能·音视频·ai视频
咚咚王者6 分钟前
人工智能之核心技术 深度学习 第五章 Transformer模型
人工智能·深度学习·transformer
zuozewei7 分钟前
7D-AI系列:AI大模型应用性能核心指标:TTFT 与 TPOT 详解
人工智能
WZGL123010 分钟前
银发经济新浪潮:适老化设计如何催生“青春化”市场
人工智能
逄逄不是胖胖11 分钟前
《动手学深度学习》-57长短期记忆网络LSTM
人工智能·深度学习·lstm
LASDAaaa123113 分钟前
基于DETR的花卉种类识别与分类系统详解
人工智能·数据挖掘
数琨创享TQMS质量数智化16 分钟前
国有大型交通运输设备制造集团QMS质量管理平台案例
大数据·人工智能·物联网
yhdata17 分钟前
绿色能源新动力:硫酸亚铁助力锂电池产业,年复合增长率攀升至14.8%
大数据·人工智能
围炉聊科技22 分钟前
从机械扫描到逻辑阅读:DeepSeek-OCR 2的技术革新
人工智能·ocr