大模型之Prompt研究和技巧

大模型之Prompt编写
- 简介
- 组成
- 技术
- - Zero-Shot
  - Few-shot
  - COT
  - COT-SC
  - TOT
  - GoT
  - ReAct

大模型之Prompt编写

简介

Prompt是是给 AI **模型的指令，**一个简短的文本输入，用于引导AI模型生成特定的回答或执行特定任务。
Prompt是你与语言模型沟通的方式。一个好的Prompt可以让AI更准确地理解你的需求，从而给出更有用的回答。

组成

Prompt的组成拆解主要包括以下六个要素：

任务（Task）: 任务是Prompt的核心，通常以动词开始，明确表达你希望ChatGPT完成的任务或目标。这可以包括生成文本、给予建议、写作内容等。可以有多个任务，以清晰地定义你的需求。
上下文（Context）: 上下文提供了与任务相关的背景信息，以确保ChatGPT理解问题的背景和约束条件。这包括用户的背景信息、成功标准、所处环境等。上下文对于任务的明确性和有效性至关重要。
示例（Exemplars）: 示例是提供具体例子或框架的部分，用来引导ChatGPT生成更准确的输出。提供示例可以明确示范所需的内容和格式，从而提高输出质量。但并不是每次都需要提供示例，有时候也可以让ChatGPT自行生成。
角色（Persona）: 角色明确指定ChatGPT和Bard（如果涉及到虚构的角色）所扮演的角色或身份。这可以是具体的人，也可以是虚构的角色，有助于调整语气和内容以适应特定角色的需求。
格式（Format）: 格式部分可视化了你期望输出的外观和结构，如表格、列表、段落等。明确指定输出的格式可以确保ChatGPT生成的内容符合你的预期。
语气（Tone）: 语气定义了输出文本的语气或风格，如正式、非正式、幽默等。指定语气有助于确保ChatGPT的回应符合所需的情感和风格要求。

通过合理组织这六个要素，你可以创建一个清晰明了的Prompt，有效引导ChatGPT生成符合期望的文本输出。

当创建一个Prompt时，下面是一些具体的例子，展示如何使用上述六个要素：

1. 任务（Task）：

生成一篇有关太阳能发电的文章。
给予我一些建议，以降低生活中的碳足迹。
写一封感谢信，以表达对客户的感激之情。

2. 上下文（Context）：

作为一个学生，你要写一篇有关气候变化的研究报告，希望获得深入了解可再生能源的信息。
你是一位环保活动家，需要有关减少塑料污染的可行性计划。
你正在回顾一次商务合作，需要一封感谢信来强调合作的重要性。

3. 示例（Exemplars）：

作为示例，可以提供一些有关太阳能的统计数据，或者一个类似的文章的开头段落。
作为示例，列出一些环保措施，如减少用塑料制品、使用可再生能源等。
提供一些已经写好的感谢信段落，以供参考。

4. 角色（Persona）：

请以一位环保组织的志愿者的身份来回答。
请以一位科学家的身份来回答。
请以一位公司首席执行官的身份来回答。

5. 格式（Format）：

请以段落的形式写一篇文章，包括标题、引言、正文和结论。
请以列表形式列出减少碳足迹的建议。
请以正式书信的格式写一封感谢信，包括日期、地址、称呼等。

6. 语气（Tone）：

请使用正式的语气，避免使用俚语或口语。
请使用轻松的语气，可以适当加入幽默元素。
请使用感激之情的语气，表达真诚的感谢。

这些示例突出了如何根据具体的需求来组成Prompt，以确保ChatGPT能够理解任务、上下文、示例、角色、格式和语气，并生成相应的内容。通过合理搭配这些要素，可以引导ChatGPT产生符合要求的文本回应。

技术

Zero-Shot

Zero-Shot Prompting 指的是在大型语言模型(LLM)中,不需要额外微调或训练,直接通过文本提示就可以完成指定的下游任务。
主要思想是:

先训练一个通用的大型语言模型,学习语言的基本规则,掌握丰富的常识和知识。

然后在不改变模型参数的情况下,只通过软性提示指导模型完成特定任务。

模型根据提示和已掌握的知识,生成对应任务的输出。
举个例子，我们可以给 ChatGPT 一个简短的 prompt，比如 描述某部电影的故事情节，它就可以生成一个关于该情节的摘要，而不需要进行电影相关的专门训练。
Zero-Shot Prompting 技术依赖于预训练的语言模型，这些模型可能会受到训练数据集的限制和偏见。它的输出有时可能不够准确，或不符合

预期。这可能需要对模型进⾏进⼀步的微调或添加更多的提示⽂本来纠正。

Few-shot

Few-shot Prompting 是 Zero-shot Prompting的扩展,指使用很少量的任务相关示例来辅助提示,使模型更快适应新任务。
其关键思想是:

仍然基于预训练好的通用语言模型

使用软提示指导模型完成新任务

额外提供1-2个相关示例作为提示补充

例如：

任务： 生成一篇关于太阳能的文章。

示例：

示例1：太阳能是一种清洁能源，通过太阳能电池板将太阳能转化为电力。
示例2：太阳能电池板通常安装在屋顶上，可以为家庭提供可再生能源。
示例3：太阳能是减少温室气体排放的重要途径。

任务描述： 请以这些示例为基础，撰写一篇关于太阳能的文章，重点介绍太阳能的工作原理、应用领域以及对环境的影响。

COT

论⽂表明，它仅在⼤于等于 100B 参数的模型中使⽤才会有效。如果是⼩样本模型，这个⽅法不会⽣效。

思维链提示，就是把一个多步骤推理问题，分解成很多个中间步骤，分配给更多的计算量，生成更多的 token，再把这些答案拼接在一起进行求解。

COT-SC

让模型⽣成多个思维链，然后取最多数答案的作为最终结果。

其实重复运算多次，取概率最⾼的那⼀个，需要借助脚本辅助完成这个功能。
Self-consistency是对CoT方法的改进，相比于CoT只进行一次采样回答，SC采用了多次采样的思想，最终选择consistent的回答作为最终答案。SC的成立的基础是文章认为，一个复杂的推理问题可以采用多种不同的方式进行解决，最终都可以得到正确答案。人类思考同一个问题可能会有不同的思路，但是最后可能得到相同的结论。可以理解为"一题多解""条条大路通罗马"。SC相比于CoT性能进一步得到了更大的提升。

通过多次采样回答，最终选择一致性最高的结果作为最终结果，这在很大程度上可以避免LLM随机性带来的错误问题。

TOT

Tree of Thoughts（ToT）框架，⽤于改进语⾔模型（LMs）的推理能⼒。该框架是对流⾏的"Chain of Thought"⽅法的⼀种

泛化，允许模型在解决问题的过程中进⾏更多的探索和策略性前瞻。

ToT允许模型⾃我评估不同的选择，以决定下⼀步的⾏动，并在必要时进⾏前瞻或回溯，以做出全局性的选择。

在24点游戏中，使⽤链式思考提示的GPT-4仅解决了4%的任务，⽽使⽤ToT⽅法的成功率达到了74%

在其他场景中的应用型不是很大。

GoT

GoT有三种操作：

Aggregation
Refining
Generation

Aggregation指的是几个想法的整合，变成了一个更好的想法，图上表现为多个节点指向同一个节点；
Refining指节点自身进行反思，不断改善自己本身的内容，图上表现为一个节点重新指向自己；
Generation指通过一个节点，产生了后续1个或者更多新的想法，图上表现为一个节点指向一个或多个节点。

ReAct

和langchain 中的Agent是一个道理

使用 LLM 以交错的方式生成推理轨迹和特定于任务的动作，从而实现两者之间更大的协同作用。
推理轨迹帮助模型归纳、跟踪和更新行动计划以及处理异常，而操作允许它与外部源（例如知识库或环境）交互，以收集附加信息。我们应用我们的方法，名为 ReAct，适应各种语言和决策任务，并证明其在最先进的基线上的有效性，以及比没有推理或行动组件的方法提高的人类可解释性和可信度。
具体来说，在问答（HotpotQA）和事实验证（Fever）方面，ReAct 通过与简单的维基百科 API 交互，克服了思维链推理中普遍存在的幻觉和错误传播问题，并生成类似人类的任务解决轨迹，比没有推理痕迹的基线更容易解释。