智能体设计模式第一章：提示链

[Aconda Jupyter 基础](#Aconda Jupyter 基础)
- 环境创建
- [Jupyter 基础功能](#Jupyter 基础功能)
提示链

Aconda Jupyter 基础

环境创建

javascript 复制代码

1. 在 Aconda 直接创建一个新的环境。

javascript 复制代码

2. 选中刚刚创建的环境。

javascript 复制代码

3. 在 Home 页面 找到 jupyter 组件，第一次应该是 Install（安装），我这边下载过了。

javascript 复制代码

4. 再返回 Environments 打开终端（Open Terminal）。

javascript 复制代码

5. 导航到你创建好的工程目录。

javascript 复制代码

6. 键入 jupyter notebook，打开 jupyter。

javascript 复制代码

7. 这样就证明打开正常。

javascript 复制代码

8. 在你的工程文件夹 新建一个 .txt 文档。

javascript 复制代码

9. 更改名称为 .env 注意没有扩展名。

javascript 复制代码

10. .env 文件里面存放你的API KEY，DeepSeek、Qwen、Gemini 等等，后期会调用。

javascript 复制代码

.env 内容示例

javascript 复制代码

# OpenAI API 密钥
OPENAI_API_KEY = ***
# 留空则用官方默认，走代理或兼容网关时才填
OPENAI_API_BASE = https://api.deepseek.com/v1

# Google Gemini
GOOGLE_API_KEY = ***
GEMINI_MODEL = gemini-2.5-flash      # 或 gemini-1.5-flash / gemini-1.5-pro 

# DeepSeek
DEEPSEEK_API_KEY = ***
DEEPSEEK_BASE_URL = https://api.deepseek.com/v1
DEEPSEEK_MODEL=deepseek-chat

# Qwen
QWEN_API_KEY = ***
QWEN_BASE_URL = https://dashscope.aliyuncs.com/compatible-mode/v1
QWEN_MODEL=qwen-max

# DASHSCOPE_API_KEY 等于 QWEN_API_KEY 
DASHSCOPE_API_KEY = ***

Jupyter 基础功能

javascript 复制代码

1. 运行正常之后，默认浏览器会自动打开一个网页，显示类似的内容，可能没有这些文件。

javascript 复制代码

2. 点击 New -> Notebook 新建 笔记本。

javascript 复制代码

3. 新建完成之后，会让你选择内核，一般默认就行。

javascript 复制代码

4. 点击可更改当前创建文件名称，按你自己喜好修改就行。

javascript 复制代码

5. 选中的这个叫单元格，选中之后，按 Ctrl + Enter 可以执行当前单元格内容。
   左边中括号中会显示第几步执行的，当然如果有输出，会在当前单元格下方展示。

javascript 复制代码

6. 单元格功能按键依次是：
   复制当前单元格到下方
   当前单元格下移一位
   当前单元格上移一位
   在上方添加一个空白单元格
   在下方添加一个空白单元格
   删除当前单元格

javascript 复制代码

7. 当前笔记本功能依次是：
   保存
   添加空白单元格
   剪切
   复制
   粘贴
   运行当前单元格
   停止内核
   刷新内核
   重新启动内核并运行所有单元格
   单元格显示风格

提示链

提示链模式概述

提示链模式，也称为「管道模式」，是利用大语言模型处理复杂任务的一种强大范式。它不期望用单一步骤解决复杂问题，而是采用「分而治之」策略。其核心思想是将难题拆解为一系列更小、更易管理的子问题。每个子问题通过专门设计的提示独立解决，前一步的输出传递给下一步作为输入。

这种顺序处理技术天然具备模块化和清晰性特点。通过分解复杂任务，每个独立步骤都变得更易于理解和调试，从而使整个流程更加稳健、更具可解释性。链条中的每一步都可以被精心设计和优化，专注于解决整体问题中的某个特定方面，最终带来更精准、更聚焦的输出。

上一步的输出成为下一步的输入，这一点至关重要。这种信息传递建立起一个依赖链（链式结构由此得名），前序操作的上下文和结果引导后续处理。这使得模型能够在先前工作的基础上不断深化理解，逐步接近最终期望的解决方案。

提示链不仅能分解问题，还能整合外部知识与工具。每一步都可以指示模型调用外部系统、API或数据库，极大丰富其知识和能力，突破训练数据的局限。这让模型从孤立的个体，演变为更广阔智能系统中的关键组件。

单一提示的局限性：对于包含多个子任务的复杂任务，使用单一复杂提示往往效率不高。模型可能难以同时满足多项约束和指示，从而出现以下问题：忽视部分指令、上下文漂移（Contextual Drift）、早期错误被放大、上下文超出窗口限制导致信息不足，以及因认知负担重而产生幻觉。

例如，要求模型在单次调用中同时完成分析市场报告、总结要点、识别趋势和草拟邮件等多项任务，失败概率极高。模型或许能给出不错的总结，但在提取精确数据或撰写得体邮件这类更细致的环节上，就很容易出错。

通过顺序分解提升可靠性：提示链通过将复杂任务分解成一个聚焦的、顺序性的工作，显著提升了可靠性与可控性。以上述例子来说，一个流水线或链式方法可以描述如下：

初始提示（总结）："请总结以下市场研究报告的核心发现：[报告文本]。" 模型的唯一焦点是总结，这大大提高了第一步的准确性。
第二个提示（识别趋势）："基于以上总结，请识别出三大新兴趋势，并提取支持每个趋势的具体数据：[第一步的输出]。"这个提示的约束性更强，并且直接建立在一个经过验证的输出之上。
第三个提示（撰写邮件）："请起草一封简洁的邮件给市场团队，概述以下趋势及其支持数据：[第二步的输出]。"

这种分解让我们可以对过程进行更精细的控制。每一步都更简单、更明确，从而降低了模型的认知负荷，带来更准确、更可靠的最终输出。

这种模块化类似于计算流水线：每个函数执行特定操作后，将结果传递给下一步。为了确保每个任务的响应都精确无误，我们还可以在每个阶段为模型赋予不同角色。例如，在上述场景中，初始提示可指定模型扮演「市场分析师」，后续提示指定为「行业分析师」，第三个提示则指定为「专业文档撰写人」。

结构化输出的作用：提示链的可靠性高度依赖于步骤间传递数据的完整性。如果一个提示的输出模棱两可或格式不佳，后续的提示可能会因错误的输入而失败。为了缓解这一问题，指定一个结构化的输出格式至关重要，例如 JSON 或 XML。

javascript 复制代码

例如，趋势识别步骤的输出可以格式化为 JSON 对象：

javascript 复制代码

{
  "trends": [
    {
      "trend_name": "人工智能驱动的个性化服务",
      "supporting_data": "73% 的消费者更倾向于与那些利用个人信息来优化购物体验的品牌开展业务合作。"
    },
    {
      "trend_name": "可持续且符合标准的品牌",
      "supporting_data": "在过去五年中，带有环境、社会及治理（ESG）相关标签的产品销售额增长了 28%，而无此类标签的产品销售额仅增长了 20%。"
    }
  ]
}

这种结构化格式确保数据可被机器读取，能够被精确解析并无歧义地插入到下一个提示中。这样可以减少因解析自然语言而产生的错误，是构建稳健多步骤大语言模型应用的重要环节。

实际应用场景

提示链是一种通用模式，可应用于构建智能体系统的多种场景。其核心效用在于将复杂问题分解为顺序的、可管理的步骤。以下是一些实际应用和用例：

1. 信息处理工作流：许多任务涉及对原始信息进行多重转换。例如，总结一份文档，提取关键实体，然后用这些实体查询数据库或生成报告。一个提示链可能如下所示：

复制代码

 Prompt 1：从给定的 URL 或文档中提取文本内容。 	
 Prompt 2：总结清洗后的文本。
 Prompt 3：从总结或原文中提取特定实体（如姓名、日期、地点）。
 Prompt 4：使用这些实体搜索内部知识库。
 Prompt 5：结合总结、实体和搜索结果，生成最终报告。

此方法被广泛应用于自动化内容分析、AI 驱动的研究助手开发以及复杂报告生成等领域。

2. 复杂问答：回答需要多步推理或信息检索的复杂问题是提示链的典型应用场景。例如，"1929 年股市崩盘的主要原因是什么？政府的应对政策又是什么？"

复制代码

 Prompt 1：识别用户查询中的核心子问题（崩盘原因、政府对策）。
 Prompt 2：研究或检索关于 1929 年崩盘原因的信息。
 Prompt 3：研究或检索关于 1929 年股市崩盘的政府对策信息。
 Prompt 4：将步骤 2 和 3 的信息整合成一个连贯的答案，回答原始问题。

这种顺序处理的方法是构建具备多步推理和信息整合能力的 AI 系统的关键。当一个问题无法仅凭单一信息解决，而必须经过一系列逻辑步骤或整合多个信息源才能作答时，这种模式就显得尤为重要。

例如，一个针对特定主题生成详尽报告的研究智能体会执行混合计算工作流。首先，系统会检索大量相关文章。然后，需要从每篇文章中提取关键信息，这一任务可以针对所有来源并发执行。由于各个提取任务相互独立，这个阶段非常适合采用并行处理，从而实现效率最大化。

然而，一旦各自的提取任务完成，整个流程就转变为顺序执行。系统必须先汇集整合所有提取的数据，再将其综合成一份逻辑连贯的初稿，最后对初稿进行审阅和润色，形成最终报告。后续的每一个阶段在逻辑上都依赖于前一阶段的顺利完成，环环相扣。这正是提示链模式发挥作用的时刻：汇集的数据成为后续综合步## 标题骤的输入，而综合生成的文本又成为最后审阅步骤的输入。因此，复杂工作流通常采用混合模式：对独立的数据采集任务并行处理，对依赖关系明确的整合与优化步骤使用提示链。

3. 数据提取和转换：将非结构化文本转换为结构化格式通常需要一个迭代过程，通过多轮迭代可以提升输出的准确性和完整性。

复制代码

  Prompt 1：尝试从发票中提取特定字段（如姓名、地址、金额）。 	
 		处理：检查是否提取了所有必需的字段，以及是否符合格式要求。
  Prompt 2：如果字段缺失或格式不正确，构建一个新提示，要求模型专门查找缺失或处理格式不正确的信息，并可提供上一次失败的上下文。
 	 	处理：再次验证结果。如有必要，重复此过程。
 	 	输出：提供经过验证的结构化数据。

这种顺序处理的方法论，尤其适用于从表单、发票或邮件等非结构化来源中进行数据提取与分析。例如，在对 PDF 进行 OCR 识别时，采用分解式的多步方法会远比单次请求更为有效。

首先，系统调用大语言模型从图像中提取文本。随后，模型处理这些原始输出进行数据规范化，比如将「一千零五十」这样的文本转换为数值 1050。由于精确数学计算对大语言模型来说是一项挑战，在后续步骤中，系统会将需要的算术运算交给外部计算器执行。模型负责识别需要的运算，将规范化后的数字传递给计算工具，然后将精确结果整合回来。通过文本提取、数据规范化、外部工具调用的链式流程，系统可获得精确结果，这是单次模型调用难以实现的。

4. 内容生成工作流：复杂内容的创作通常被分解为不同阶段，包括初步构思、搭建大纲、起草和修订等。

复制代码

 Prompt 1：基于用户的兴趣爱好，生成 5 个主题。 	
 		处理：允许用户选择一个主题或自动选择最好的一个。 
 Prompt 2：基于选定的主题，生成详细的大纲。
 Prompt 3：基于大纲的第一点，撰写初稿。 在提供前一部分上下文的情况下，根据大纲的第二点撰写草稿，并以此类推完成所有要点。
 Prompt 4：审阅和润色完整的初稿，确保连贯性、语气和语法。

这种方法适用于多种自然语言生成任务，比如自动撰写创意故事、编写技术文档以及生成其他结构化文本内容。

5. 有状态的对话智能体：虽然完善的状态管理架构需要比顺序链接更复杂的方法，但提示链为维持对话连续性提供了基础机制。核心思想是将每轮对话构建为新提示，系统性地融入先前交互产生的信息或提取的实体。

复制代码

 Prompt 1：处理用户的第一轮发言，识别意图和关键实体。
 	处理：更新对话状态，包含意图和实体。
 Prompt 2：基于当前状态，生成响应或识别下一个所需的信息。

在后续的对话中重复此过程，用户的每一句新话语都会启动一个新的处理链，并充分利用不断积累的对话历史（即状态）。

这一原则对于开发对话智能体至关重要，使智能体在多轮对话中保持上下文理解和逻辑连贯性。通过保留对话历史，系统就能够理解并恰当地回应那些依赖于先前交换信息的后续输入。

6. 代码生成和优化：可用代码的生成通常是一个多阶段的过程，它要求将问题分解为一系列可有序执行的逻辑操作。

复制代码

 Prompt 1：理解用户的需求，生成伪代码或大纲。
 Prompt 2：基于大纲，编写初始版本的代码。
 Prompt 3：识别代码中可能存在的错误或需要改进的地方（使用静态分析工具或另外调用一次模型）。 
 Prompt 4：基于识别出的问题，重写或优化代码。
 Prompt 5：添加文档或测试用例。

在 AI 辅助软件开发等应用中，提示链的价值在于将复杂编码任务分解为一系列可管理的子问题，这种模块化结构降低了模型在每一步的复杂度。更重要的是，这种方法允许我们在两次模型调用之间插入确定性逻辑，从而在工作流中实现中间数据处理、输出验证和条件分支等功能。通过这种方式，一个原本可能导致不可靠或不完整结果的单一复杂请求，被转化为由底层执行框架管理的结构化操作序列。

7. 多模态和多步推理：分析包含多种模态（如图像、文本、表格）的数据时，必须将问题分解为更小的、基于提示的任务。例如，要解读一张复杂的图像，其中不仅有图片和文本，还有对特定文本段的高亮标注，以及采用表格来解释每个标签的情况，就需要采用这样的方法。

复制代码

 Prompt 1：从用户的图像请求中提取并理解文本内容。 
 Prompt 2：将提取出的图像文本与其对应的标签进行关联。
 Prompt 3： 利用表格来解读已收集到的信息，以确定最终需要输出的内容。

实践示例

实现提示链的方法有很多，从直接在脚本中依次调用函数，到利用专门的框架来管理控制流、状态和组件集成，形式不一。像 LangChain、LangGraph、Crew AI 以及谷歌智能体开发套件（ADK）这类框架，能为构建和执行多步流程提供结构化的环境，这对于复杂的系统架构尤其有益。

为了演示，LangChain 和 LangGraph 是非常合适的选择，因为它们的核心 API 就是为组合操作链（Chains）和图（Graphs）而设计的。LangChain 为线性序列提供了基础的抽象，而 LangGraph 则在此基础上进一步扩展，支持有状态和循环计算，这对于实现更复杂的智能体行为至关重要。本示例将聚焦于一个基础的线性序列。

下面的代码实现了一个两步的提示链，它就像一个数据处理流水线。第一步旨在解析非结构化文本并提取特定信息；第二步则接收上一步的输出，并将其转换为结构化的数据格式。

要运行此示例，首先需要安装必要的库：

javascript 复制代码

如果以来没有安装 就安装一下：

javascript 复制代码

# %pip install -U langchain==1.0.2 langchain-core==0.3.79 langchain-openai==1.0.1 langchain-community==0.4 langgraph python-dotenv pydantic openai

javascript 复制代码

API KEY 文件读取：

javascript 复制代码

# pip install python-dotenv openai --upgrade
import os
from dotenv import load_dotenv
from openai import OpenAI

# 载入 .env 文件内容
load_dotenv()
print("DEEPSEEK_API_KEY =", os.getenv("DEEPSEEK_API_KEY"))

# 检查是否成功读取
print("DEEPSEEK_API_KEY =", os.getenv("DEEPSEEK_API_KEY"))

client = OpenAI(
    api_key=os.getenv("DEEPSEEK_API_KEY"),
    base_url=os.getenv("DEEPSEEK_BASE_URL", "https://api.deepseek.com/v1")
)

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "你是一个智能助手"},
        {"role": "user", "content": "你好"},
    ]
)
print(response.choices[0].message.content)

javascript 复制代码

如果成功就会输出类似这样的回答。

请注意，langchain-openai 可以替换为其他模型提供商的相应库包。此外，你必须在运行环境中配置好所选语言模型（如 OpenAI、Google Gemini 或 Anthropic）的 API 密钥。

javascript 复制代码

完整示例代码：

javascript 复制代码

# -*- coding: utf-8 -*-
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser

# 1) 读取 .env
load_dotenv()

# 2) 直接显式传参，最稳
DEEPSEEK_KEY = os.getenv("DEEPSEEK_API_KEY")
DEEPSEEK_URL = os.getenv("DEEPSEEK_BASE_URL", "https://api.deepseek.com/v1")
if not DEEPSEEK_KEY:
    raise RuntimeError("未读取到 DEEPSEEK_API_KEY，请检查 .env")

# 3) 初始化 DeepSeek（OpenAI 兼容）
llm = ChatOpenAI(
    model="deepseek-chat",
    temperature=0.2,
    api_key=DEEPSEEK_KEY,
    base_url=DEEPSEEK_URL,
)

# 4) Prompt 1：提取信息
prompt_extract = ChatPromptTemplate.from_template(
    "请提取以下文本中的硬件参数（CPU、内存、存储）：\n\n{text_input}"
)

# 5) Prompt 2：转成 JSON（要求仅输出 JSON）
prompt_transform = ChatPromptTemplate.from_template(
    "请将以下参数整理为 JSON 对象，键为 cpu、memory、storage：\n\n{specifications}\n\n"
    "只输出合法 JSON，勿输出任何解释或多余文本。"
)

# 6) 构建链
extraction_chain = prompt_extract | llm | StrOutputParser()
full_chain = {"specifications": extraction_chain} | prompt_transform | llm | StrOutputParser()

# 7) 测试输入
input_text = "这款笔记本配备3.5GHz八核处理器、16GB内存和1TB NVMe固态硬盘。"

# 8) 执行
final_result = full_chain.invoke({"text_input": input_text})

# 9) 输出
print("\n--- Final JSON Output ---")
print(final_result)

javascript 复制代码

LangChain + DeepSeek：提取硬件参数 → JSON

javascript 复制代码

# deepseek_lcel_pipeline.py
# -*- coding: utf-8 -*-
"""
LangChain + DeepSeek：提取硬件参数 → JSON
- 稳健：显式传参 api_key/base_url，不依赖全局 OPENAI_* 环境。
- 兼容：顶部补丁规避旧包对 `content`、`block_translators` 的导入错误。
- 可选：强约束 JSON 输出（Pydantic + JsonOutputParser）。
- 两用：脚本单独运行 / Jupyter Notebook 直接运行。
---------------------------------------------------------------------
.env 示例（与本文件/Notebook 同目录）：
    DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx
    DEEPSEEK_BASE_URL=https://api.deepseek.com/v1
# 如需同时支持 OpenAI（可选）：
#   OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx
"""

# ─────────────────── 兼容性补丁：防止旧依赖导入崩溃 ───────────────────
import sys, types, importlib
try:
    _m = importlib.import_module("langchain_core.messages")
    if not hasattr(_m, "content"):
        def _content(**kwargs):  # 旧代码常写 content(type="text", text="...") 等
            return kwargs
        setattr(_m, "content", _content)
        sys.modules["langchain_core.messages"].content = _content
except Exception:
    pass

if "langchain_core.messages.block_translators" not in sys.modules:
    _dummy = types.ModuleType("langchain_core.messages.block_translators")
    def _noop(*args, **kwargs): return args or kwargs
    _dummy.blocks_to_messages = _noop
    _dummy.messages_to_blocks = _noop
    sys.modules["langchain_core.messages.block_translators"] = _dummy
# ───────────────────────────────────────────────────────────────────

import os
from typing import Optional, Literal

from dotenv import load_dotenv
from pydantic import BaseModel, Field, ValidationError

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser


# ───────────────────────── 基础工具 ─────────────────────────
def _require_env(name: str) -> str:
    """读取必需环境变量；为空则报错并给出修复建议。"""
    v = os.getenv(name)
    if not v:
        raise RuntimeError(
            f"未读取到环境变量 {name}。请在 .env 中设置：\n"
            f"    {name}=<你的值>\n"
            f"并确保 .env 与本脚本/Notebook 同目录，且已调用 load_dotenv()。"
        )
    return v


def create_llm(provider: Literal["deepseek", "openai"] = "deepseek",
               model: Optional[str] = None,
               temperature: float = 0.2) -> ChatOpenAI:
    """
    创建 LLM 客户端。
    provider:
        - "deepseek": 使用 DeepSeek（OpenAI 兼容网关）
        - "openai"  : 使用 OpenAI 官方
    model:
        - deepseek: 默认 "deepseek-chat"
        - openai  : 自行传入如 "gpt-4o"
    """
    if provider == "deepseek":
        api_key = _require_env("DEEPSEEK_API_KEY")
        base_url = os.getenv("DEEPSEEK_BASE_URL", "https://api.deepseek.com/v1")
        return ChatOpenAI(
            model=model or "deepseek-chat",
            temperature=temperature,
            api_key=api_key,
            base_url=base_url,
        )
    elif provider == "openai":
        api_key = _require_env("OPENAI_API_KEY")
        # 对 OpenAI 使用默认 base_url（不要覆写）
        return ChatOpenAI(
            model=model or "gpt-4o",
            temperature=temperature,
            api_key=api_key,
        )
    else:
        raise ValueError(f"未知 provider: {provider}")


# ───────────────────── 强约束 JSON 的数据结构 ─────────────────────
class Specs(BaseModel):
    cpu: str = Field(description="CPU 型号/主频")
    memory: str = Field(description="内存容量（如 16GB）")
    storage: str = Field(description="存储信息（如 1TB NVMe SSD）")


def build_chain_string(llm: ChatOpenAI):
    """普通字符串版：提取 → 转 JSON（两步走，宽松，易上手）"""
    prompt_extract = ChatPromptTemplate.from_template(
        "请提取以下文本中的硬件参数（CPU、内存、存储）：\n\n{text_input}"
    )
    prompt_transform = ChatPromptTemplate.from_template(
        "请将以下参数整理为 JSON 对象，键为 cpu、memory、storage：\n\n{specifications}\n\n"
        "只输出合法 JSON，勿输出任何解释或多余文本。"
    )
    extraction_chain = prompt_extract | llm | StrOutputParser()
    full_chain = {"specifications": extraction_chain} | prompt_transform | llm | StrOutputParser()
    return full_chain


def build_chain_json(llm: ChatOpenAI):
    """强约束 JSON 版：一步完成（JsonOutputParser + Pydantic）"""
    parser = JsonOutputParser(pydantic_object=Specs)
    prompt = ChatPromptTemplate.from_template(
        "从下面文本中提取硬件规格，并严格输出 JSON：\n"
        "文本：{text_input}\n\n"
        "{format_instructions}"
    ).partial(format_instructions=parser.get_format_instructions())
    chain = prompt | llm | parser
    return chain


# ─────────────────────────── 主流程 ───────────────────────────
def run_pipeline(
    text_input: str,
    provider: Literal["deepseek", "openai"] = "deepseek",
    model: Optional[str] = None,
    strict_json: bool = True,
) -> dict:
    """
    运行参数提取管线。
    strict_json=True 使用强约束 JSON 版；否则使用字符串拼接版（更宽松）。
    返回：dict（包含 cpu/memory/storage）
    """
    # 载入 .env（多次调用也安全）
    load_dotenv()

    llm = create_llm(provider=provider, model=model, temperature=0.2)

    if strict_json:
        chain = build_chain_json(llm)
        result = chain.invoke({"text_input": text_input})
    
        # ✅ 新增兼容处理
        if isinstance(result, dict):
            return result
        elif hasattr(result, "model_dump"):
            return result.model_dump()
        else:
            raise RuntimeError(f"Unexpected result type: {type(result)} -> {result}")
    else:
        chain = build_chain_string(llm)
        raw = chain.invoke({"text_input": text_input})
        # 这里返回原始字符串；如需转 dict，可在外层 json.loads(raw)
        return {"raw": raw}


# ─────────────────────────── CLI/Notebook 示例 ───────────────────────────
if __name__ == "__main__":
    # 示例文本
    sample = "这款笔记本配备3.5GHz八核处理器、16GB内存和1TB NVMe固态硬盘。"

    # 1) 强约束 JSON 版（推荐）
    data = run_pipeline(sample, provider="deepseek", strict_json=True)
    print("=== Strict JSON ===")
    print(data)  # {'cpu': '...', 'memory': '...', 'storage': '...'}

    # 2) 普通字符串版（如你更想控制提示词风格）
    data2 = run_pipeline(sample, provider="deepseek", strict_json=False)
    print("\n=== String (raw JSON text) ===")
    print(data2["raw"])

javascript 复制代码

输出是这样的：

这段 Python 代码演示了如何使用 LangChain + DeepSeek OpenAI 兼容接口 来完成一个「文本信息抽取 → 结构化 JSON 输出」的小型管线。它的目标是：从一段自然语言描述中提取出 CPU、内存、存储 三类硬件参数，并最终返回一个可直接使用的 JSON 字典。

代码首先做了一个兼容性补丁 ，用于规避某些旧版本 LangChain 依赖在导入 content 或 block_translators 时可能出现的报错，保证脚本在不同环境里更稳定运行。随后它通过 load_dotenv() 读取本地 .env 文件中的 DEEPSEEK_API_KEY 和 DEEPSEEK_BASE_URL，并使用 ChatOpenAI 作为统一的客户端入口，让 DeepSeek 或 OpenAI 都可以用相同写法调用。

在业务逻辑层面，这段代码提供了两种"链式处理方式"：

1. 宽松模式（两步走）：

先用一个 Prompt 从文本里提取硬件参数，再用第二个 Prompt 把提取结果整理成 JSON。输出通过 StrOutputParser() 转成纯字符串，适合提示词自由度更高、调试更直观的场景。

2. 严格模式（一步到位，推荐）：

使用 Pydantic 定义 Specs 数据结构，并配合 JsonOutputParser 强制模型严格输出 cpu/memory/storage 三个字段的合法 JSON。这样可以显著降低模型输出格式跑偏的问题，结果也能直接作为 dict 使用。

代码中通过 LangChain 的 LCEL（LangChain Expression Language） 来把 prompt、模型和解析器用 | 符号优雅地串起来，形成可复用的链条。最后在 main 中提供了一段笔记本配置示例文本，并调用 run_pipeline() 运行整条链路，打印出最终提取的硬件规格 JSON 结果。

上下文工程和提示工程

上下文工程是一门系统性的学科，致力于在 AI 模型生成词元（Token）之前，如何为其设计、构建并提供一个完整的信息环境。这一方法论主张，模型输出的质量与其说取决于模型自身的架构，不如说更依赖于所提供上下文的丰富程度。

上下文工程是一门为 AI 构建丰富、全面信息环境的学科，因为高质量的上下文是支撑高级智能体性能的首要因素。

它代表了对传统提示工程（Prompt Engineering）的一次重大演进，后者主要聚焦于优化用户当前调用的输入。上下文工程则将这一范畴大大拓宽，囊括了多个信息层面。比如系统提示（System Prompt 可以作为一套基础指令，用来定义 AI 的运行参数，比如「你是一位技术文档撰写者，你的语气必须正式且精准」。

上下文还会通过外部数据得到进一步丰富。这包括检索到的文档，即 AI 主动从知识库中获取信息以支撑其回答，例如获取一个项目的技术规范。它同样也包含工具输出，这来源于 AI 调用外部接口获取实时数据，比如查询日历以确定用户的空闲时间。这些显式数据会与关键的隐式数据（如用户身份、交互历史和环境状态）相结合。其核心原则是：即便是最先进的模型，如果提供给它的运行环境视图是有限或结构不良的，其表现也会大打折扣。

因此，这种实践将任务的重点从仅仅回答问题重构为为智能体构建全面的操作全貌。举例来说，一个经过上下文工程的智能体不会只是简单地回应查询，而是会首先整合用户的空闲时间（工具输出）、与邮件接收者的职业关系（隐式数据）以及过往的会议纪要（检索到的文档）。这使得模型能够生成高度相关、个性化且具有实际价值的输出。「工程」二字体现在创建稳定的流水线，以便在运行时获取和转换这些数据，并建立反馈循环来持续提升上下文的质量。

为了实现这一点，我们可以使用专门的调优系统来大规模自动化这一改进过程。例如，像谷歌的 Vertex AI 提示优化器这类工具，可以通过系统性地评估模型响应（基于一组样本输入和预定义的评估指标）来提升模型性能。这种方法能有效地让提示和系统指令适配不同的模型，而无需大量手动重写。通过为这类优化器提供样本提示、系统指令和一个模板，它就能够程序化地优化上下文输入，为实现复杂的上下文工程所需的反馈循环提供一种结构化的方法。

正是这种结构化的方法，将一个基础的 AI 工具与一个更复杂、更具上下文感知能力的系统区分开来。它将上下文本身视为一个核心组件，极度重视智能体知道什么、何时知道以及如何使用这些信息。这一实践的核心是确保模型能全面洞悉用户的意图、历史背景及其当前所处的环境。归根结底，上下文工程是将无状态的聊天机器人提升为能力强大、具备情境感知能力系统的关键方法论。

要点速览

问题所在：用单个提示处理复杂任务，往往会让大语言模型不堪重负，导致性能骤降。过高的认知负荷会增加模型出错的概率，例如忽略指令、丢失上下文、生成错误信息等。这种大而全的指令，很难有效管理多个约束条件和环环相扣的推理步骤，最终导致输出结果既不可靠，也不准确。

解决之道：提示链模式的精髓在于化整为零，它将一个复杂的问题分解为一系列更小、且环环相扣的子任务，从而提供了一套标准化的解法。链条中的每一步都使用一个高度聚焦的提示来执行特定操作，极大地提升了可靠性与可控性。上一步的输出会作为下一步的输入，由此创建出一个逻辑清晰的工作流，逐步构建出最终的解决方案。这种模块化的策略，让整个过程更易于管理和调试，并允许在步骤之间集成外部工具或结构化数据。该模式是开发能够规划、推理和执行复杂工作流的高级智能体系统的基础。

适用场景：如果一项任务过于复杂，单个提示难以胜任；或涉及多个独立的处理步骤；或需要在步骤间与外部工具交互；亦或在构建需要多步推理和状态维持的智能体系统时，都可考虑使用此模式。

javascript 复制代码