Demystifying Prompts in Language Models via Perplexity Estimation

Demystifying Prompts in Language Models via Perplexity Estimation

原文链接

Gonen H, Iyer S, Blevins T, et al. Demystifying prompts in language models via perplexity estimation[J]. arXiv preprint arXiv:2212.04037, 2022.

简单来说就是作者通过在不同LLM和不同任务上的实验,发现低困惑度的prompt更能提升LLM的性能 ,如下图所示,困惑度和acc大致呈一个负相关的趋势。

作者为了证明自己的猜想,先手写了少量人工prompt,之后交给LLM paraphrase,包括用命令让LLM直接重写以及来回翻译(翻译成别的语言再翻译回来),从而得到了大量prompt。作者之后测试了这些prompt的性能,并计算了困惑度和表现得相似度,基本都是负相关。

基于此,作者提出了一种新的prompt方式,也就是先手写,再paraphrase,最后根据困惑度筛选。

相关推荐
艾派森几秒前
深度学习实战-基于EfficientNetB5的家禽鸡病图像分类识别模型
人工智能·python·深度学习·神经网络·分类
研究点啥好呢4 分钟前
快手多模态算法工程师面试题精选:10道高频考题+答案解析
java·开发语言·人工智能·ai·面试·笔试
深海鱼在掘金6 分钟前
深入浅出 LangChain —— 第八章:RAG 检索增强生成
人工智能·langchain·agent
深海鱼在掘金8 分钟前
深入浅出 LangChain —— 第九章:多 Agent 系统
人工智能·langchain·agent
用户0688668175116 分钟前
Windows端Codex接入第三方模型(DeekSeek,BaiLian)
人工智能
陈天伟教授18 分钟前
AI 未来趋势:产业应用范式之变
大数据·开发语言·人工智能·gpt
Luhui Dev22 分钟前
AHE 深度解析:Coding Agent 的 Harness 如何自动演化
人工智能·agent·luhuidev
码农的神经元23 分钟前
从论文复现到模型升级:Transformer-Attention-WOA-XGBoost 在含新能源配电网故障诊断中的实现
人工智能·深度学习·transformer
EnCi Zheng23 分钟前
04-缩放点积注意力代码实现 [特殊字符]
人工智能·pytorch·python
一江寒逸24 分钟前
5个免费开源大模型API,完美平替OpenAI,个人开发完全够用了(2026最新保姆级指南)
人工智能·个人开发