LangChain 老喻干货店提示词工程

AutoGen、LangChain、LlamaIndex玩了一圈,越来越感觉Prompt Engineering 才是核心。欢迎大家一起学习AIGC、AGI,欢迎点赞,评论区讨论。

前言

上篇文章我们以I/O的视角来看待大模型。本文我们将继续深入LangChain在I/O的三个阶段的给力组件,让我们更好的开发AI应用。

提示词模板类型

提示词模板方便复用、接收参数、可以定制。根据用途(String 和 Chat )可以分为两类:StringPromptTemplate和BaseChatpromptTemplate(chat 有特定的结构)。再根据具体场景,我们来学习下LangChain的PromptTemplate:

  • PromptTemplate

最常用的String 提示词模板,可以接受input_variables、partial_variables。

  • ChatPromptTemplate

根据角色不同,分为ChatMessagePromptTemplate、HumanMessagePromptTemplate、AIMessagePromptTemplate和SystemMessagePrompt。

  • FewShotPromptTemplate

在prompt中加入一些"教学",教模型如何回答。fewshot 是少量样本的意思

  • PipelinePrompt

可以将几个提示组合在一起

  • 自定义模板

可以继承模板类, 开发自己的模板类

如上图,Prompts是LangChain的核心模块,我们可以从Prompts模块导入以上各种类型的模块。

python 复制代码
from langchain.prompts.prompt import PromptTemplate
from langchain.prompts import FewShotPromptTemplate
from langchain.prompts.pipeline import PipelinePromptTemplate
from langchain.prompts import ChatPromptTemplate
from langchain.prompts import (
    ChatMessagePromptTemplate,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

# 当然直接从langchain引入也可以
from langchain import PromptTemplate

PromptTemplate

ini 复制代码
from langchain import PromptTemplate

template = """\
你是一位资深咨询顾问。
你给一个在线销售{product}的电商公司,取个好的名字?
"""
prompt = PromptTemplate.from_template(template)

print(prompt.format(product="干货"))

输出结果:

你是一位资深咨询顾问。
你给一个在线销售干货的电商公司,取个好的名字?

这就是最简单的PromptTemplate input_variables的例子,{product}是占位符,通过from_template方法创建了一个提示词模板对象,调用对象的format方法,将传入的variable替换占位符生成最后的prompt。在产品层面,PromptTemplate 让AI程序因为提示词模板可以适用更多的应用场景。真的可以用它干点活。

我们也可以直接调用PromptTemplate构造函数直接完成prompt对象的创建,而不是调用from_template方法。

ini 复制代码
prompt = PromptTemplate(
    input_variables=["product", "age"], 
    template="你是一位资深咨询顾问。对于一个面向{age}市场的,专注于销售{product}的公司,你会推荐哪个名字?"
)
print(prompt.format(product="干货", market="老年"))

ChatPromptTemplate

各种聊天模板不同的地方主要在于它们有不同的角色(系统、用户和助理)。首条信息是系统信息,用于设置助理的身份或行为,接下来提出问题的是用户,回答问题的是大模型的助手。传给大模型的是消息对象的数组。

ini 复制代码
import openai
openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
        {"role": "system", "content": "你是一位专业食疗医生"},
        {"role": "user", "content": "请问血糖比较高午餐应该怎么吃?"},
        {"role": "assistant", "content": "一般情况下,血糖高的人午餐吃粗粮、高纤维的食物"},
        {"role": "user", "content": "高纤维的食物有哪些?"}
    ]
)

FewShot

机器学习中有Few-Shot(少量样本)、One-Shot(单样本)和Zero-Shot(零样本)的概念,用于教大模型怎么做。Zero-Shot,你希望大模型自己去悟,这便是禅宗。怪不得Facebook要请少林寺大和尚去讲AI与禅。其它就是给单个例子还是一些例子。

FewShotPromptTemplate,说白了就是方便我们将examples和template区别开来,它来组装。

ini 复制代码
# 创建FewShotPromptTemplate对象

examples = [
    {
        "food_type":"黑木耳",
        "season": "夏季",
        "benefit": "木耳生长在潮湿阴凉的环境中,可以消除血液中的热毒,起到清热解毒的功效。"
    },
    {
        "food_type": "海带",
        "season": "春季",
        "benefit":"海带有丰富的膳食纤维,有助于促进肠胃"
    }
]

# 2. 创建一个提示模板
from langchain.prompts.prompt import PromptTemplate

template="干货类型: {food_type}\n季节: {season}\n文案: {benefit}"
prompt_example = PromptTemplate(input_variables=["food_type", "season", "benefit"], 
                               template=template)
print(prompt_example.format(**example[0]))

from langchain.prompts.few_shot import FewShotPromptTemplate
prompt = FewShotPromptTemplate(
    examples=examples,
    example_prompt=prompt_example,
    suffix="干货类型: {food_type}\n季节: {season}",
    input_variables=["food_type", "season"]
)
print(prompt.format(flower_type="白木耳", occasion="夏季"))

如果示例比较多, 我们可以使用示例选择器example_selector,这样可以减少token的开销,也可以增加业务的匹配性。

ini 复制代码
# 示例选择器
from langchain.prompts.example_selector import SemanticSimilarityExampleSelector
# 向量数据库 chromadb
from langchain.vectorstores import Chroma
# 嵌入
from langchain.embeddings import OpenAIEmbeddings

# 初始化示例选择器
example_selector = SemanticSimilarityExampleSelector.from_examples(
    exmples,
    OpenAIEmbeddings(),
    Chroma,
    k=1
)

# 创建一个使用示例选择器的FewShotPromptTemplate对象
prompt = FewShotPromptTemplate(
    example_selector=example_selector, 
    example_prompt=prompt_example, 
    suffix="干货类型: {food_type}\n季节: {season}", 
    input_variables=["food_type", "season"]
)
print(prompt.format(food_type="墨鱼", occasion="秋季"))

总结

  • 深入理解了提示词模板
  • 各种模板的用法
  • FewShot 可以提高回答问题的质量

参考资料

  • 黄佳老师的LangChain课
相关推荐
神奇夜光杯9 分钟前
Python酷库之旅-第三方库Pandas(202)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
正义的彬彬侠12 分钟前
《XGBoost算法的原理推导》12-14决策树复杂度的正则化项 公式解析
人工智能·决策树·机器学习·集成学习·boosting·xgboost
Debroon22 分钟前
RuleAlign 规则对齐框架:将医生的诊断规则形式化并注入模型,无需额外人工标注的自动对齐方法
人工智能
羊小猪~~29 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
AI小杨30 分钟前
【车道线检测】一、传统车道线检测:基于霍夫变换的车道线检测史诗级详细教程
人工智能·opencv·计算机视觉·霍夫变换·车道线检测
晨曦_子画34 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
道可云36 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
人工智能培训咨询叶梓1 小时前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
zzZ_CMing1 小时前
大语言模型训练的全过程:预训练、微调、RLHF
人工智能·自然语言处理·aigc
newxtc1 小时前
【旷视科技-注册/登录安全分析报告】
人工智能·科技·安全·ddddocr