Demystifying Prompts in Language Models via Perplexity Estimation

Demystifying Prompts in Language Models via Perplexity Estimation

原文链接

Gonen H, Iyer S, Blevins T, et al. Demystifying prompts in language models via perplexity estimation[J]. arXiv preprint arXiv:2212.04037, 2022.

简单来说就是作者通过在不同LLM和不同任务上的实验,发现低困惑度的prompt更能提升LLM的性能 ,如下图所示,困惑度和acc大致呈一个负相关的趋势。

作者为了证明自己的猜想,先手写了少量人工prompt,之后交给LLM paraphrase,包括用命令让LLM直接重写以及来回翻译(翻译成别的语言再翻译回来),从而得到了大量prompt。作者之后测试了这些prompt的性能,并计算了困惑度和表现得相似度,基本都是负相关。

基于此,作者提出了一种新的prompt方式,也就是先手写,再paraphrase,最后根据困惑度筛选。

相关推荐
AI视觉网奇3 分钟前
live2d 全身数字人
人工智能·计算机视觉
HelloReader4 分钟前
用 Spark Shell 做交互式数据分析从入门到自包含应用
人工智能
_codemonster12 分钟前
AI大模型入门到实战系列(四)深入理解 Transformer 大语言模型
人工智能·语言模型·transformer
爱笑的眼睛1120 分钟前
从零构建与深度优化:PyTorch训练循环的工程化实践
java·人工智能·python·ai
c#上位机21 分钟前
halcon刚性变换(平移+旋转)——vector_angle_to_rigid
人工智能·计算机视觉·c#·上位机·halcon·机器视觉
liliangcsdn21 分钟前
如何使用pytorch模拟Pearson loss训练模型
人工智能·pytorch·python
做cv的小昊25 分钟前
VLM相关论文阅读:【LoRA】Low-rank Adaptation of Large Language Models
论文阅读·人工智能·深度学习·计算机视觉·语言模型·自然语言处理·transformer
VertGrow AI销冠25 分钟前
AI获客软件VertGrow AI销冠的自动化功能测评
人工智能
TextIn智能文档云平台26 分钟前
抽取出的JSON结构混乱,如何设计后处理规则来标准化输出?
人工智能·json