技术栈
预训练评估
lihuayong
4 小时前
人工智能
·
大模型评估
·
预训练评估
大模型预训练评估指标
关于 Language Modeling 的量化指标,较为普遍的有 [PPL],[BPC]等,可以简单理解为在生成结果和目标文本之间的 Cross Entropy Loss 上做了一些处理,这种方式可以用来评估模型对「语言模板」的拟合程度即给定一段话,预测后面可能出现哪些合法的、通顺的字词。
我是有底线的