( 教学 )Agent 构建 Prompt(提示词)2. CommaSeparatedListOutputParser

CommaSeparatedListOutputParser

CommaSeparatedListOutputParser逗号分隔列表输出解析器 是 LangChain中的一种专门的输出解析器,用于以逗号分隔列表的形式生成结构化输出。

它简化了提取和以清晰简洁的列表形式呈现数据的过程,特别适用于组织诸如数据点、名称、项目或其他结构化值等信息。通过利用这个解析器,用户可以提高数据的清晰度、确保格式的一致性,并提高工作流程的效率,尤其是在需要生成结构化输出的应用中。

如何使用 CommaSeparatedListOutputParser:

  1. 设置并初始化用于生成以逗号分隔列表的解析器
  2. 将其与提示模板和语言模型相结合
  3. 通过流式机制对结构化输出进行迭代处理

实现 CommaSeparatedListOutputParser

如果你需要生成以逗号分隔的列表形式的输出,LangChainCommaSeparatedListOutputParser可以简化这个过程。

以下是逐步实现的方法:

1. 导入所需模块

首先导入必要的模块并初始化 CommaSeparatedListOutputParser

从解析器中获取格式化指令以指导输出结构。

python 复制代码
from langchain.output_parsers import CommaSeparatedListOutputParser

# 初始化解析器
output_parser = CommaSeparatedListOutputParser()

# 获取格式化指令
format_instructions = output_parser.get_format_instructions()

2. 创建提示模板

定义一个PromptTemplate来动态生成项目列表。

占位符主题将在执行过程中被替换为所需的主题。

python 复制代码
from langchain_core.prompts import PromptTemplate

# 定义提示模板
prompt = PromptTemplate(
    template="列出五个{subject}。\n {format_instructions}",
    input_variables=["subject"],  # 'subject' 将在运行时被动态替换
    partial_variables={
        "format_instructions": format_instructions
    },  # 使用解析器的格式说明
)
print(prompt)

结果

复制代码
input_variables=['subject'] 
input_types={} 
partial_variables={'format_instructions': 'Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`'} 
template='列出五个{subject}。\n{format_instructions}'

3. 集成 ChatOpenAI并运行链式调用

PromptTemplateChatOpenAI模型和 CommaSeparatedListOutputParser组合成一个链式调用。最后,使用特定的 subject运行该链式调用以生成结果。

python 复制代码
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv
import os

load_dotenv()
Qwen2_5_7B_Instruct_llm = ChatOpenAI(
    temperature=0.1,  # 控制输出的随机性和创造性,值越低输出越稳定可预测,值越高输出越有创意但可能偏离预期 (范围: 0.0 ~ 2.0)
    model_name="Qwen/Qwen2.5-7B-Instruct",  # 硅基流动支持的模型名称
    openai_api_key=os.getenv("SILICONFLOW_API_KEY"),  # 从环境变量获取API密钥
    openai_api_base="https://api.siliconflow.cn/v1"  # 硅基流动API的基础URL
)
# 将提示、模型和输出解析器组合成链
chain = prompt | Qwen2_5_7B_Instruct_llm | output_parser

# 使用特定主题运行链
result = chain.invoke({"subject": "中国著名地标"})
print(result)

测试结果:

复制代码
['北京', '上海', '广州', '深圳', '成都']

4. 使用Python索引访问数据

由于 CommaSeparatedListOutputParser会自动将输出格式化为Python列表,你可以轻松地使用索引来访问单个元素。

例如,要访问列表中的第一个元素(北京),可以使用 result[0]

python 复制代码
print("第一个地标:", result[0])
print("第二个地标:", result[1])
print("最后一个地标:", result[-1])

测试结果:

复制代码
第一个地标: 北京
第二个地标: 上海
最后一个地标: 成都

使用流式输出

对于较大的输出或需要实时反馈的情况,你可以使用 stream方法来处理结果。这使你能够在数据生成时逐段处理数据。

python 复制代码
for output in chain.stream({"subject": "中国著名地标"}):
    print(output)

测试结果:

复制代码
[北京]
[上海]
[广州]
[深圳]
[成都]

应用方向

  • 数据提取:从文本中提取结构化数据,如姓名、地址、日期等。

  • 内容分类:将文本分类为不同的主题或类别。

  • 自动摘要:生成文本的摘要或关键词。

  • 问答系统:构建基于文本的问答系统,回答用户问题。

    成都

    应用方向

    • 数据提取:从文本中提取结构化数据,如姓名、地址、日期等。
    • 内容分类:将文本分类为不同的主题或类别。
    • 自动摘要:生成文本的摘要或关键词。
    • 问答系统:构建基于文本的问答系统,回答用户问题。
    • 内容生成:根据用户输入或主题生成新的文本内容。
相关推荐
zhougl99615 小时前
Java 常见异常梳理
java·开发语言·python
deep_drink15 小时前
【基础知识二】彻底读懂拉普拉斯矩阵 (Laplacian)
人工智能·深度学习·线性代数·矩阵
垂钓的小鱼115 小时前
保姆级最新OpenClaw(原 Clawdbot/Moltbot)安装指南,建立隧道,外网浏览器也能访问,并接入飞书,让AI在聊天软件里帮你干活
人工智能·飞书
sensen_kiss15 小时前
Jupter Notebook 使用教程
大数据·人工智能·python·学习·数据分析
雨大王51215 小时前
如何选择适合自己企业的工业智能体解决方案?
人工智能·汽车·制造
海绵宝宝de派小星15 小时前
经典CNN架构:LeNet、AlexNet、VGG、GoogLeNet、ResNet
人工智能·神经网络·ai·cnn
Fleshy数模15 小时前
深度学习入门:从神经网络构造到模型训练全解析
人工智能·深度学习·神经网络
多恩Stone15 小时前
【3D-AICG 系列-3】Trellis 2 的O-voxel (下) Material: Volumetric Surface Attributes
人工智能·3d·aigc
八月瓜科技15 小时前
2026春晚机器人专利战:从舞台秀到资本竞逐的产业突围
大数据·人工智能·microsoft·机器人·娱乐
多恩Stone15 小时前
【3D-AICG 系列-1】Trellis v1 和 Trellis v2 的区别和改进
人工智能·pytorch·python·算法·3d·aigc