文章目录
上一篇放不下了,拆出来一篇。
temperature温度
在大模型中,温度用来控制模型输出随机性和创造性的核心参数。
温度越低,发散性越低,生成结果越确定。# 如 代码生成用低温度
温度越高,发散性越高,生成结果越不确定。 # 如 写小说用高温度
top-p
生成中的又一概念,一般和温度结合使用。
为什么要用top-p?
如果温度很高,分布会变的很散,会随机从这些很散的内容里面选,风险很高。
如果设置top-p为90%,会根据候选词的概率排序,然后累加到90%,这样限定了候选词的范围。
在发散的前提下,又保证了质量。