大语言模型:Large Language Models Are Human-Level Prompt Engineers概述

研究内容

如何通过prompt,在不进行微调大语言模型的前提下,增加大语言模型的表现

研究动机

  • prompt非常有用,但是人工设置的非常不自然;
  • 因此提出了要自动使用大语言模型自己选择prompt;
  • 取得了很好的效果。

作者主要是提出了三件事:

如何让大语言模型生成prompt

LLM是可以分为两类的,

  • 其中一类GPT是只能从前到后的,他们不支持句子补全(在一段话当中填写空缺位置);
  • 另一类,则是可以反向的例如T5、GLM、 InsertGPT,这些模型就会支持句子补全。

因此作者为这两类模型分别设置了两种方法,例子如下:

同时作者指出,也不一定要和这俩完全相同,使用回答评价指标一定可以找到一个更加适合指令instruction生成的prompt这里只是样板(template)。作者给出了在本文实验当中实际采用的prompt:

如何评价这些prompt

就是简单的让其跑一下分

如何进一步优化prompt

可以使用大语言模型进一步resample跑一下选出来的高分指令instruction:

再在这些指令当做选择更好的指令。

相关推荐
caiyueloveclamp5 小时前
2025年AI生成PPT工具评测:以“全链路一体化服务能力”为尺,ChatPPT再登顶
人工智能·powerpoint·ai生成ppt·aippt
husterlichf5 小时前
回归问题——相关误差指标数学概念详解以及sklearn.metrics相关方法
人工智能·机器学习·线性回归
骥龙5 小时前
2.4、恶意软件猎手:基于深度学习的二进制文件判别
人工智能·深度学习·网络安全
寒秋丶5 小时前
Milvus:数据库层操作详解(二)
数据库·人工智能·python·ai·ai编程·milvus·向量数据库
hans汉斯6 小时前
【计算机科学与应用】基于BERT与DeepSeek大模型的智能舆论监控系统设计
大数据·人工智能·深度学习·算法·自然语言处理·bert·去噪
大模型真好玩6 小时前
LangChain1.0速通指南(二)——LangChain1.0 create_agent api 基础知识
人工智能·langchain·mcp
开放知识图谱6 小时前
论文浅尝 | 图约束推理:在知识图谱上实现大语言模型的忠实推理(ICML2025)
人工智能·语言模型·自然语言处理·知识图谱
机器之心6 小时前
英伟达发射了首个太空AI服务器,H100已上天
人工智能·openai
西柚小萌新6 小时前
【深入浅出PyTorch】--8.1.PyTorch生态--torchvision
人工智能·pytorch·python
m0_650108246 小时前
【论文精读】迈向更好的指标:从T2VScore看文本到视频生成的新评测范式
人工智能·论文精读·评估指标·文本到视频生成·t2vscore·tvge数据集·视频质量评估