Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集 ,然后从这个词集中随机选择一个词作为输出。

例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积 :模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到) 。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止 ,此时所包含的词就构成了用于采样的候选词集
  • 随机采样 :从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
相关推荐
Shawn_Shawn2 小时前
大模型的奥秘:Token与Transformer简单理解
人工智能·llm
weixin_377634844 小时前
【K-S 检验】Kolmogorov–Smirnov计算过程与示例
人工智能·深度学习·机器学习
菜鸟起航ing4 小时前
Spring AI 全方位指南:从基础入门到高级实战
java·人工智能·spring
Guheyunyi5 小时前
智慧消防管理系统如何重塑安全未来
大数据·运维·服务器·人工智能·安全
ZZY_dl5 小时前
训练数据集(三):真实场景下采集的课堂行为目标检测数据集,可直接用于YOLO各版本训练
人工智能·yolo·目标检测
yiersansiwu123d5 小时前
AI伦理治理:在创新与规范之间寻找动态平衡
人工智能
华清远见成都中心5 小时前
成都理工大学&华清远见成都中心实训,助力电商人才培养
大数据·人工智能·嵌入式
鲨莎分不晴6 小时前
强化学习第五课 —— A2C & A3C:并行化是如何杀死经验回放
网络·算法·机器学习
爱好读书6 小时前
AI生成er图/SQL生成er图在线工具
人工智能
CNRio6 小时前
智能影像:AI视频生成技术的战略布局与产业变革
人工智能