LangChain学习之模型 I/O 与输出解析器 (Output Parsers)(3/8)

模块 3: 模型 I/O 与输出解析器 (Output Parsers)

3.1 模型 I/O 概述

在 LangChain 中,模型 I/O (Input/Output) 指的是如何将输入传递给语言模型,以及如何处理和理解模型的输出。虽然 LLM 和 Chat Models 都能处理文本,但它们的输入和输出格式有所不同。本模块将重点介绍如何有效地管理模型的输出,特别是如何将非结构化的文本输出转换为结构化的数据格式 [1]。

3.2 输出解析器 (Output Parsers)

大型语言模型通常以自由文本的形式生成响应,这对于许多应用程序来说可能不够理想。输出解析器 (Output Parsers) 的作用就是将 LLM 的原始文本输出转换为更结构化、更易于程序处理的格式,例如 JSON 对象、列表或特定的数据类型。LangChain 提供了多种内置的输出解析器,并且允许自定义 [2]。

3.2.1 列表输出解析器 (List Output Parser)

当您希望模型生成一个项目列表时,可以使用 CommaSeparatedListOutputParser。它会将模型输出的逗号分隔字符串解析成一个字符串数组。

typescript 复制代码
import { CommaSeparatedListOutputParser } from "@langchain/core/output_parsers";
import { PromptTemplate } from "@langchain/core/prompts";
import { ChatOpenAI } from "@langchain/openai";

const parser = new CommaSeparatedListOutputParser();

const model = new ChatOpenAI({
  model: "deepseek-v4-flash",
  temperature: 0,
  apiKey: process.env.DEEPSEEK_API_KEY,
  configuration: {
    baseURL: "https://api.deepseek.com",
  },
});

const chain = PromptTemplate.fromTemplate(
  "列出 5 种适合夏季的水果。\n{format_instructions}"
).pipe(model).pipe(parser);

const result = await chain.invoke({
  format_instructions: parser.getFormatInstructions(),
});

console.log(result);
// 示例输出: [ \'西瓜\', \'甜瓜\', \'草莓\', \'芒果\', \'葡萄\' ]

3.2.2 JSON 输出解析器 (JSON Output Parser)

当您需要模型生成 JSON 格式的结构化数据时,StructuredOutputParser 是一个非常强大的工具。它允许您定义期望的 JSON 结构,并会生成相应的提示词指令,引导模型输出符合该结构的 JSON。如果模型输出不符合预期,解析器会尝试修复或抛出错误 [3]。

StructuredOutputParser 通常与 Zod 库结合使用,以定义严格的 JSON Schema。

typescript 复制代码
import { StructuredOutputParser } from "@langchain/core/output_parsers";
import { PromptTemplate } from "@langchain/core/prompts";
import { ChatOpenAI } from "@langchain/openai";
import { z } from "zod";

// 定义期望的 JSON 结构
const parser = StructuredOutputParser.fromZodSchema(
  z.object({
    answer: z.string().describe("对用户问题的回答"),
    source: z.string().optional().describe("回答的来源,如果知道的话"),
  })
);

const model = new ChatOpenAI({
  model: "deepseek-v4-flash",
  temperature: 0,
  apiKey: process.env.DEEPSEEK_API_KEY,
  configuration: {
    baseURL: "https://api.deepseek.com",
  },
});

const chain = PromptTemplate.fromTemplate(
  "回答用户的问题。\n{format_instructions}\n{question}"
).pipe(model).pipe(parser);

const result = await chain.invoke({
  format_instructions: parser.getFormatInstructions(),
  question: "地球的周长是多少?",
});

console.log(result);
/*
示例输出:
{
  answer: \'地球的赤道周长约为 40,075 公里。\',
  source: \'维基百科\'
}
*/

3.2.3 自定义输出解析器

如果内置的解析器不能满足您的需求,您可以实现 BaseOutputParser 接口来创建自定义的输出解析器。这需要您实现 parse 方法,该方法接收模型的原始字符串输出并返回您期望的格式。

typescript 复制代码
import { BaseOutputParser } from "@langchain/core/output_parsers";

class CustomOutputParser extends BaseOutputParser<string[]> {
  lc_namespace = ["my_app", "output_parsers"];

  async parse(text: string): Promise<string[]> {
    // 假设模型输出是每行一个项目
    return text.split("\n").map((item) => item.trim());
  }

  getFormatInstructions(): string {
    return "请以每行一个项目的形式列出结果。";
  }
}

// 使用自定义解析器
const customParser = new CustomOutputParser();
// ... 可以像其他解析器一样将其集成到链中

参考文献

1\] LangChain.js Model I/O. (n.d.). Docs by LangChain. Retrieved from \[2\] LangChain.js Output Parsers. (n.d.). Docs by LangChain. Retrieved from \[3\] LangChain.js Structured Output. (n.d.). Docs by LangChain. Retrieved from

相关推荐
windawdaysss1 小时前
离线学习SQL和数据库的工具及其部署
数据库·sql·学习
lqj_本人1 小时前
鸿蒙PC:electron-markdownify 从普通 Electron 迁移到 OpenHarmony Electron HAP 的完整实践
前端·javascript·electron
倾颜1 小时前
AI 应用里的第一个 Agent:我如何做一个可控的 Tasklist Agent
langchain·agent·next.js
代码搬运媛9 小时前
Jest 测试框架详解与实现指南
前端
吃好睡好便好10 小时前
在Matlab中绘制横直方图
开发语言·学习·算法·matlab
counterxing10 小时前
我把 Codex 里的 Skills 做成了一个 MCP,还支持分享
前端·agent·ai编程
wangqiaowq10 小时前
windows下nginx的安装
linux·服务器·前端
nashane10 小时前
HarmonyOS 6学习:CapsLock键失效诊断与长截图完整实现指南
学习·华为·harmonyos
之歆10 小时前
DAY_12JavaScript DOM 完全指南(二):实战与性能篇
开发语言·前端·javascript·ecmascript