Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集 ,然后从这个词集中随机选择一个词作为输出。

例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积 :模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到) 。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止 ,此时所包含的词就构成了用于采样的候选词集
  • 随机采样 :从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
相关推荐
HeartException22 分钟前
量子计算+AI芯片:光子计算如何重构神经网络硬件生态
人工智能
摸鱼仙人~26 分钟前
Minstrel:多智能体协作生成结构化 LangGPT 提示词
人工智能·提示词
AI街潜水的八角1 小时前
深度学习图像分类数据集—濒危动物识别分类
人工智能·深度学习
安思派Anspire2 小时前
LangGraph + MCP + Ollama:构建强大代理 AI 的关键(一)
前端·深度学习·架构
程序员陆通2 小时前
独立开发A/B测试实用教程
人工智能·ai编程
knowfoot2 小时前
硬核拆解!跟着公式“走”一遍,你也能彻底看懂神经网络
人工智能·神经网络
FF-Studio2 小时前
大语言模型(LLM)课程学习(Curriculum Learning)、数据课程(data curriculum)指南:从原理到实践
人工智能·python·深度学习·神经网络·机器学习·语言模型·自然语言处理
DDDDDouble2 小时前
<二>Sping-AI alibaba 入门-记忆聊天及持久化
java·人工智能
PyAIExplorer2 小时前
图像处理中的插值方法:原理与实践
图像处理·人工智能
狗头大军之江苏分军2 小时前
疑似华为盘古AI大模型翻车造假风波【实时记录篇】
人工智能·机器学习·程序员