LangChain学习之模型 I/O 与输出解析器 (Output Parsers)(3/8)

模块 3: 模型 I/O 与输出解析器 (Output Parsers)

3.1 模型 I/O 概述

在 LangChain 中,模型 I/O (Input/Output) 指的是如何将输入传递给语言模型,以及如何处理和理解模型的输出。虽然 LLM 和 Chat Models 都能处理文本,但它们的输入和输出格式有所不同。本模块将重点介绍如何有效地管理模型的输出,特别是如何将非结构化的文本输出转换为结构化的数据格式 1

3.2 输出解析器 (Output Parsers)

大型语言模型通常以自由文本的形式生成响应,这对于许多应用程序来说可能不够理想。输出解析器 (Output Parsers) 的作用就是将 LLM 的原始文本输出转换为更结构化、更易于程序处理的格式,例如 JSON 对象、列表或特定的数据类型。LangChain 提供了多种内置的输出解析器,并且允许自定义 2

3.2.1 列表输出解析器 (List Output Parser)

当您希望模型生成一个项目列表时,可以使用 CommaSeparatedListOutputParser。它会将模型输出的逗号分隔字符串解析成一个字符串数组。

typescript 复制代码
import { CommaSeparatedListOutputParser } from "@langchain/core/output_parsers";
import { PromptTemplate } from "@langchain/core/prompts";
import { ChatOpenAI } from "@langchain/openai";

const parser = new CommaSeparatedListOutputParser();

const model = new ChatOpenAI({
  model: "deepseek-v4-flash",
  temperature: 0,
  apiKey: process.env.DEEPSEEK_API_KEY,
  configuration: {
    baseURL: "https://api.deepseek.com",
  },
});

const chain = PromptTemplate.fromTemplate(
  "列出 5 种适合夏季的水果。\n{format_instructions}"
).pipe(model).pipe(parser);

const result = await chain.invoke({
  format_instructions: parser.getFormatInstructions(),
});

console.log(result);
// 示例输出: [ \'西瓜\', \'甜瓜\', \'草莓\', \'芒果\', \'葡萄\' ]

3.2.2 JSON 输出解析器 (JSON Output Parser)

当您需要模型生成 JSON 格式的结构化数据时,StructuredOutputParser 是一个非常强大的工具。它允许您定义期望的 JSON 结构,并会生成相应的提示词指令,引导模型输出符合该结构的 JSON。如果模型输出不符合预期,解析器会尝试修复或抛出错误 3

StructuredOutputParser 通常与 Zod 库结合使用,以定义严格的 JSON Schema。

typescript 复制代码
import { StructuredOutputParser } from "@langchain/core/output_parsers";
import { PromptTemplate } from "@langchain/core/prompts";
import { ChatOpenAI } from "@langchain/openai";
import { z } from "zod";

// 定义期望的 JSON 结构
const parser = StructuredOutputParser.fromZodSchema(
  z.object({
    answer: z.string().describe("对用户问题的回答"),
    source: z.string().optional().describe("回答的来源,如果知道的话"),
  })
);

const model = new ChatOpenAI({
  model: "deepseek-v4-flash",
  temperature: 0,
  apiKey: process.env.DEEPSEEK_API_KEY,
  configuration: {
    baseURL: "https://api.deepseek.com",
  },
});

const chain = PromptTemplate.fromTemplate(
  "回答用户的问题。\n{format_instructions}\n{question}"
).pipe(model).pipe(parser);

const result = await chain.invoke({
  format_instructions: parser.getFormatInstructions(),
  question: "地球的周长是多少?",
});

console.log(result);
/*
示例输出:
{
  answer: \'地球的赤道周长约为 40,075 公里。\',
  source: \'维基百科\'
}
*/

3.2.3 自定义输出解析器

如果内置的解析器不能满足您的需求,您可以实现 BaseOutputParser 接口来创建自定义的输出解析器。这需要您实现 parse 方法,该方法接收模型的原始字符串输出并返回您期望的格式。

typescript 复制代码
import { BaseOutputParser } from "@langchain/core/output_parsers";

class CustomOutputParser extends BaseOutputParser<string[]> {
  lc_namespace = ["my_app", "output_parsers"];

  async parse(text: string): Promise<string[]> {
    // 假设模型输出是每行一个项目
    return text.split("\n").map((item) => item.trim());
  }

  getFormatInstructions(): string {
    return "请以每行一个项目的形式列出结果。";
  }
}

// 使用自定义解析器
const customParser = new CustomOutputParser();
// ... 可以像其他解析器一样将其集成到链中

参考文献

1 LangChain.js Model I/O. (n.d.). Docs by LangChain. Retrieved from https://js.langchain.com/docs/modules/model_io/

2 LangChain.js Output Parsers. (n.d.). Docs by LangChain. Retrieved from https://js.langchain.com/docs/modules/model_io/output_parsers/

3 LangChain.js Structured Output. (n.d.). Docs by LangChain. Retrieved from https://js.langchain.com/docs/modules/model_io/output_parsers/structured

相关推荐
kyriewen1 小时前
Anthropic 估值逼近万亿美元,Claude Sonnet 5 + Claude Science 一天两连发
前端·ai编程·claude
小徐_23333 小时前
Wot UI 2.2.0 发布:Button 新增 subtle,VideoPreview 预览体验继续增强
前端·微信小程序·uni-app
天蓝色的鱼鱼5 小时前
关于 CSS 你可能不知道的属性,但关键时刻很有用
前端·css
泯泷6 小时前
第 2 篇:设计第一套字节码:Opcode、Instruction 与 Constant Pool
前端·javascript·安全
妙码生花6 小时前
从 PHP 到 AI + Golang,程序员自救转型手记(十五):优化细节、网络请求封装
前端·后端·ai编程
泯泷6 小时前
第 1 篇:从 1 + 2 开始:亲手写出第一台 JSVM
前端·javascript·安全
团团崽_七分甜6 小时前
Spring Boot 核心知识点总结
前端
lichenyang4536 小时前
从一个按钮开始,理解 ASCF 框架到底在做什么
前端
古夕7 小时前
第三方 SSO 接入实践:redirect_uri 编码、回调一致性与跨项目联调
前端·vue.js