LangChain 老喻干货店提示词工程

AutoGen、LangChain、LlamaIndex玩了一圈,越来越感觉Prompt Engineering 才是核心。欢迎大家一起学习AIGC、AGI,欢迎点赞,评论区讨论。

前言

上篇文章我们以I/O的视角来看待大模型。本文我们将继续深入LangChain在I/O的三个阶段的给力组件,让我们更好的开发AI应用。

提示词模板类型

提示词模板方便复用、接收参数、可以定制。根据用途(String 和 Chat )可以分为两类:StringPromptTemplate和BaseChatpromptTemplate(chat 有特定的结构)。再根据具体场景,我们来学习下LangChain的PromptTemplate:

  • PromptTemplate

最常用的String 提示词模板,可以接受input_variables、partial_variables。

  • ChatPromptTemplate

根据角色不同,分为ChatMessagePromptTemplate、HumanMessagePromptTemplate、AIMessagePromptTemplate和SystemMessagePrompt。

  • FewShotPromptTemplate

在prompt中加入一些"教学",教模型如何回答。fewshot 是少量样本的意思

  • PipelinePrompt

可以将几个提示组合在一起

  • 自定义模板

可以继承模板类, 开发自己的模板类

如上图,Prompts是LangChain的核心模块,我们可以从Prompts模块导入以上各种类型的模块。

python 复制代码
from langchain.prompts.prompt import PromptTemplate
from langchain.prompts import FewShotPromptTemplate
from langchain.prompts.pipeline import PipelinePromptTemplate
from langchain.prompts import ChatPromptTemplate
from langchain.prompts import (
    ChatMessagePromptTemplate,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

# 当然直接从langchain引入也可以
from langchain import PromptTemplate

PromptTemplate

ini 复制代码
from langchain import PromptTemplate

template = """\
你是一位资深咨询顾问。
你给一个在线销售{product}的电商公司,取个好的名字?
"""
prompt = PromptTemplate.from_template(template)

print(prompt.format(product="干货"))

输出结果:

你是一位资深咨询顾问。
你给一个在线销售干货的电商公司,取个好的名字?

这就是最简单的PromptTemplate input_variables的例子,{product}是占位符,通过from_template方法创建了一个提示词模板对象,调用对象的format方法,将传入的variable替换占位符生成最后的prompt。在产品层面,PromptTemplate 让AI程序因为提示词模板可以适用更多的应用场景。真的可以用它干点活。

我们也可以直接调用PromptTemplate构造函数直接完成prompt对象的创建,而不是调用from_template方法。

ini 复制代码
prompt = PromptTemplate(
    input_variables=["product", "age"], 
    template="你是一位资深咨询顾问。对于一个面向{age}市场的,专注于销售{product}的公司,你会推荐哪个名字?"
)
print(prompt.format(product="干货", market="老年"))

ChatPromptTemplate

各种聊天模板不同的地方主要在于它们有不同的角色(系统、用户和助理)。首条信息是系统信息,用于设置助理的身份或行为,接下来提出问题的是用户,回答问题的是大模型的助手。传给大模型的是消息对象的数组。

ini 复制代码
import openai
openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {"role": "system", "content": "你是一位专业食疗医生"},
        {"role": "user", "content": "请问血糖比较高午餐应该怎么吃?"},
        {"role": "assistant", "content": "一般情况下,血糖高的人午餐吃粗粮、高纤维的食物"},
        {"role": "user", "content": "高纤维的食物有哪些?"}
    ]
)

FewShot

机器学习中有Few-Shot(少量样本)、One-Shot(单样本)和Zero-Shot(零样本)的概念,用于教大模型怎么做。Zero-Shot,你希望大模型自己去悟,这便是禅宗。怪不得Facebook要请少林寺大和尚去讲AI与禅。其它就是给单个例子还是一些例子。

FewShotPromptTemplate,说白了就是方便我们将examples和template区别开来,它来组装。

ini 复制代码
# 创建FewShotPromptTemplate对象

examples = [
    {
        "food_type":"黑木耳",
        "season": "夏季",
        "benefit": "木耳生长在潮湿阴凉的环境中,可以消除血液中的热毒,起到清热解毒的功效。"
    },
    {
        "food_type": "海带",
        "season": "春季",
        "benefit":"海带有丰富的膳食纤维,有助于促进肠胃"
    }
]

# 2. 创建一个提示模板
from langchain.prompts.prompt import PromptTemplate

template="干货类型: {food_type}\n季节: {season}\n文案: {benefit}"
prompt_example = PromptTemplate(input_variables=["food_type", "season", "benefit"], 
                               template=template)
print(prompt_example.format(**example[0]))

from langchain.prompts.few_shot import FewShotPromptTemplate
prompt = FewShotPromptTemplate(
    examples=examples,
    example_prompt=prompt_example,
    suffix="干货类型: {food_type}\n季节: {season}",
    input_variables=["food_type", "season"]
)
print(prompt.format(flower_type="白木耳", occasion="夏季"))

如果示例比较多, 我们可以使用示例选择器example_selector,这样可以减少token的开销,也可以增加业务的匹配性。

ini 复制代码
# 示例选择器
from langchain.prompts.example_selector import SemanticSimilarityExampleSelector
# 向量数据库 chromadb
from langchain.vectorstores import Chroma
# 嵌入
from langchain.embeddings import OpenAIEmbeddings

# 初始化示例选择器
example_selector = SemanticSimilarityExampleSelector.from_examples(
    exmples,
    OpenAIEmbeddings(),
    Chroma,
    k=1
)

# 创建一个使用示例选择器的FewShotPromptTemplate对象
prompt = FewShotPromptTemplate(
    example_selector=example_selector, 
    example_prompt=prompt_example, 
    suffix="干货类型: {food_type}\n季节: {season}", 
    input_variables=["food_type", "season"]
)
print(prompt.format(food_type="墨鱼", occasion="秋季"))

总结

  • 深入理解了提示词模板
  • 各种模板的用法
  • FewShot 可以提高回答问题的质量

参考资料

  • 黄佳老师的LangChain课
相关推荐
网络研究院36 分钟前
如何安全地大规模部署 GenAI 应用程序
网络·人工智能·安全·ai·部署·观点
凭栏落花侧41 分钟前
决策树:简单易懂的预测模型
人工智能·算法·决策树·机器学习·信息可视化·数据挖掘·数据分析
xiandong204 小时前
240929-CGAN条件生成对抗网络
图像处理·人工智能·深度学习·神经网络·生成对抗网络·计算机视觉
innutritious5 小时前
车辆重识别(2020NIPS去噪扩散概率模型)论文阅读2024/9/27
人工智能·深度学习·计算机视觉
橙子小哥的代码世界5 小时前
【深度学习】05-RNN循环神经网络-02- RNN循环神经网络的发展历史与演化趋势/LSTM/GRU/Transformer
人工智能·pytorch·rnn·深度学习·神经网络·lstm·transformer
985小水博一枚呀7 小时前
【深度学习基础模型】神经图灵机(Neural Turing Machines, NTM)详细理解并附实现代码。
人工智能·python·rnn·深度学习·lstm·ntm
SEU-WYL8 小时前
基于深度学习的任务序列中的快速适应
人工智能·深度学习
OCR_wintone4218 小时前
中安未来 OCR—— 开启高效驾驶证识别新时代
人工智能·汽车·ocr
matlabgoodboy8 小时前
“图像识别技术:重塑生活与工作的未来”
大数据·人工智能·生活
最近好楠啊8 小时前
Pytorch实现RNN实验
人工智能·pytorch·rnn