LARGE LANGUAGE MODELS ARE HUMAN-LEVEL PROMPT ENGINEERS

Tags: LLM

Authors: Andrei Ioan Muresanu, Harris Chan, Jimmy Ba, Keiran Paster, Silviu Pitis, Yongchao Zhou, Ziwen Han

Created Date: October 31, 2023 10:53 AM

Status: Reading

organization: University of Toronto, University of Waterloo, Vector Institute

publisher : ICLR

year: 2023

code: https://github.com/keirp/automatic_prompt_engineer

paper: https://sites.google.com/view/automatic-prompt-engineer

介绍

在大模型时代,提示的作用非常巨大,一个好的提示可以在任务中表现出极好的性能。但通常来说最有效的提示是由人手工制作的,需要耗费大量的人工开销。因此本文就尝试让大语言模型自动生提示本并优化提示。

整体框架

整体流程如下:

  1. 利用大语言模型,根据数据集中的输入和输出,构造多个提示。
  2. 对每个提示进行打分。
  3. 筛选性能较好的提示,让大语言模型根据筛选结果生成相近的提示
  4. 选择最优的提示。

不同生成模板

为了适应不同的需求,作者还设计了三种不同的模板

迭代生成

为了更好地搜索优质提示,作者根据当前得分较好的提示进行重新生成。

实验结果

Greedy表示只生成一个提示,不进行筛选。

相关推荐
喵~来学编程啦2 小时前
【论文精读】LPT: Long-tailed prompt tuning for image classification
人工智能·深度学习·机器学习·计算机视觉·论文笔记
、你的风衣2 天前
FITS论文解析
人工智能·深度学习·论文笔记
迪娜学姐6 天前
科研项目:利用AI大模型获得基金资助的10个原则
论文阅读·人工智能·chatgpt·论文笔记
栀子清茶7 天前
SegNet & DeconvNet——论文阅读
论文阅读·深度学习·计算机视觉·论文笔记
源于花海8 天前
论文学习 | 《锂离子电池健康状态估计及剩余寿命预测研究》
论文阅读·人工智能·学习·论文笔记
喵~来学编程啦10 天前
【论文精读】ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection
论文阅读·计算机视觉·prompt·论文笔记·预训练模型
醒了就刷牙13 天前
《Vision-Language Pre-Training with Triple Contrastive Learning》中文校对版
人工智能·深度学习·自然语言处理·论文笔记
栀子清茶14 天前
Unsupervised Domain Adaptation in SemanticSegmentation: A Review——论文笔记
论文阅读·人工智能·深度学习·生成对抗网络·计算机视觉·论文笔记·1024程序员节
杜若南星14 天前
VASCO:增减材混合制造的体积和表面共分解
论文阅读·经验分享·笔记·算法·制造·几何学·论文笔记
、你的风衣20 天前
MICN论文解析
人工智能·机器学习·论文笔记