LARGE LANGUAGE MODELS ARE HUMAN-LEVEL PROMPT ENGINEERS

Tags: LLM

Authors: Andrei Ioan Muresanu, Harris Chan, Jimmy Ba, Keiran Paster, Silviu Pitis, Yongchao Zhou, Ziwen Han

Created Date: October 31, 2023 10:53 AM

Status: Reading

organization: University of Toronto, University of Waterloo, Vector Institute

publisher : ICLR

year: 2023

code: https://github.com/keirp/automatic_prompt_engineer

paper: https://sites.google.com/view/automatic-prompt-engineer

介绍

在大模型时代,提示的作用非常巨大,一个好的提示可以在任务中表现出极好的性能。但通常来说最有效的提示是由人手工制作的,需要耗费大量的人工开销。因此本文就尝试让大语言模型自动生提示本并优化提示。

整体框架

整体流程如下:

  1. 利用大语言模型,根据数据集中的输入和输出,构造多个提示。
  2. 对每个提示进行打分。
  3. 筛选性能较好的提示,让大语言模型根据筛选结果生成相近的提示
  4. 选择最优的提示。

不同生成模板

为了适应不同的需求,作者还设计了三种不同的模板

迭代生成

为了更好地搜索优质提示,作者根据当前得分较好的提示进行重新生成。

实验结果

Greedy表示只生成一个提示,不进行筛选。

相关推荐
大模型任我行9 天前
谷歌:预训练到微调的知识迁移规律
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行9 天前
华为:构建特征级LLM编码评测基准
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行10 天前
华为:CLI任务自动生成新范式
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行10 天前
字节:LLM自演化规则强化思维链
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行10 天前
英伟达:物理感知的多模态评判模型
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行11 天前
北大:LLM数学证明形式化验证
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行13 天前
阿里:揭示RLVR训练不稳定性根源
人工智能·语言模型·自然语言处理·论文笔记
小南知更鸟15 天前
Applied Soft Computing(应用软计算)投稿
论文笔记
大模型任我行15 天前
阿里:具身智能模型ABot-M0
人工智能·语言模型·自然语言处理·论文笔记
大模型任我行16 天前
百度:动态偏好选择提升LLM对齐稳定性
人工智能·语言模型·自然语言处理·论文笔记