大语言模型:Large Language Models Are Human-Level Prompt Engineers概述

研究内容

如何通过prompt,在不进行微调大语言模型的前提下,增加大语言模型的表现

研究动机

  • prompt非常有用,但是人工设置的非常不自然;
  • 因此提出了要自动使用大语言模型自己选择prompt;
  • 取得了很好的效果。

作者主要是提出了三件事:

如何让大语言模型生成prompt

LLM是可以分为两类的,

  • 其中一类GPT是只能从前到后的,他们不支持句子补全(在一段话当中填写空缺位置);
  • 另一类,则是可以反向的例如T5、GLM、 InsertGPT,这些模型就会支持句子补全。

因此作者为这两类模型分别设置了两种方法,例子如下:

同时作者指出,也不一定要和这俩完全相同,使用回答评价指标一定可以找到一个更加适合指令instruction生成的prompt这里只是样板(template)。作者给出了在本文实验当中实际采用的prompt:

如何评价这些prompt

就是简单的让其跑一下分

如何进一步优化prompt

可以使用大语言模型进一步resample跑一下选出来的高分指令instruction:

再在这些指令当做选择更好的指令。

相关推荐
袁庭新14 分钟前
全球首位AI机器人部长,背负反腐重任
人工智能·aigc
机器之心29 分钟前
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长
人工智能·openai
算家计算42 分钟前
AI配音革命!B站最新开源IndexTTS2本地部署教程:精准对口型,情感随心换
人工智能·开源·aigc
量子位1 小时前
马斯克周末血裁xAI 500人
人工智能·ai编程
算家计算1 小时前
OpenAI最强编程模型GPT-5-Codex发布!可独立编程7小时,编程效率提升10倍
人工智能·ai编程·资讯
聚客AI3 小时前
🌟大模型为什么产生幻觉?预训练到推理的漏洞全揭秘
人工智能·llm·掘金·日新计划
Juchecar3 小时前
一文讲清 nn.Sequential 等容器类
人工智能
阿里云云原生3 小时前
如何快速看懂「祖传项目」?Qoder 强势推出新利器
人工智能
美团技术团队3 小时前
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
人工智能·算法
程序员小袁5 小时前
基于C-MTEB/CMedQAv2-rerankingv的Qwen3-1.7b模型微调-demo
人工智能