【LangChain-AI】:宏观认知

🎬 个人主页艾莉丝努力练剑
专栏传送门 :《C语言》《数据结构与算法》《C/C++干货分享&学习过程记录
Linux操作系统编程详解》《笔试/面试常见算法:从基础到进阶》《Python干货分享

⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平


🎬 艾莉丝的简介:


文章目录

  • [一、 框架引入](#一、 框架引入)
  • [1 ~> 宏观认识 LangChain](#1 ~> 宏观认识 LangChain)
    • [1.1 课程定位与核心命题](#1.1 课程定位与核心命题)
    • [1.2 LangChain 与 AI 应用、AI 模型的关系](#1.2 LangChain 与 AI 应用、AI 模型的关系)
      • [1.2.1 实际 AI 应用的典型形态](#1.2.1 实际 AI 应用的典型形态)
      • [1.2.2 AI 应用调用模型的路径类比](#1.2.2 AI 应用调用模型的路径类比)
    • [1.3 原生 API 调用模式:趟水过溪](#1.3 原生 API 调用模式:趟水过溪)
      • [1.3.1 DeepSeek 案例:应用与模型的分层](#1.3.1 DeepSeek 案例:应用与模型的分层)
      • [1.3.2 原生 API 调用实现方式](#1.3.2 原生 API 调用实现方式)
      • [1.3.3 原生 API 返回结果结构](#1.3.3 原生 API 返回结果结构)
      • [1.3.4 原生 API 调用的核心问题](#1.3.4 原生 API 调用的核心问题)
    • [1.4 LangChain 框架模式:走桥过溪](#1.4 LangChain 框架模式:走桥过溪)
    • [1.5 核心概念区分](#1.5 核心概念区分)
    • [1.6 本节总结:LangChain 的定义](#1.6 本节总结:LangChain 的定义)
  • [2 ~> 宏观认识大模型](#2 ~> 宏观认识大模型)
    • [2.1 大模型的宏观理解](#2.1 大模型的宏观理解)
    • [2.2 大模型的核心能力](#2.2 大模型的核心能力)
    • [2.3 核心问题](#2.3 核心问题)
  • [3 ~> 大模型篇章的要点阐述](#3 ~> 大模型篇章的要点阐述)
  • [4 ~> 补充说明](#4 ~> 补充说明)
  • 总结
  • 结尾


一、 框架引入

整体学习框架导入语

本文为 LangChain 体系化学习的前言与宏观认知章节,核心目标是建立 "大模型 - LangChain-AI 应用" 三层架构的完整认知链路,厘清原生 API 调用与框架封装调用的本质差异,明确 LangChain 作为 AI 应用开发桥梁的核心价值,同时建立对大模型能力边界与缺陷的基础认知,为后续深入学习 LangChain 组件、智能体开发打下严谨的底层逻辑基础。本章从实际 AI 应用案例切入,通过类比方式拆解技术路径,最终落脚于 "如何将大模型转化为可融入业务流程的智能体" 这一核心命题,是整个 LangChain 知识体系的认知起点。

思维导图

bash 复制代码
+ 前言:LangChain宏观认知与学习框架
  |- 宏观认识LangChain
  |  |- 课程定位:零基础可上手
  |  |- 核心定位:连接AI模型与AI应用的桥梁
  |  |- AI应用调用模型的两类路径
  |  |  |- 原生API调用:趟水过溪
  |  |  `- 框架封装调用:走桥过溪
  |  |- 典型案例
  |  |  |- 豆包:生成类AI应用
  |  |  `- DeepSeek:客户端应用与开放API
  |  |- 概念区分:AI应用 ≠ 原生AI模型
  |  `- LangChain核心价值:封装流程、简化调用、扩展能力
  |- 宏观认识大模型
  |  |- 宏观类比:数字巨人、人类大脑、超级学霸
  |  |- 核心能力:泛化能力、逻辑推理能力
  |  `- 核心痛点:缺乏感知、行动与记忆能力,无法直接融入业务流程
  |- 大模型篇章学习要点
  |  |- 理解工作原理与能力边界
  |  |- 认知固有缺陷(如幻觉问题)
  |  `- 建立问题翻译的思维框架
  `- 补充说明:原生大模型正在逐步完善自身缺陷

1 ~> 宏观认识 LangChain

1.1 课程定位与核心命题

本课程面向零基础学习者,核心围绕 "如何基于 LangChain 开发实际 AI 应用" 展开。AI 应用的落地本质是解决 "AI 模型能力如何与业务场景结合" 的问题,而 LangChain 是衔接 AI 模型底层能力与上层 AI 应用的核心开发框架之一。

1.2 LangChain 与 AI 应用、AI 模型的关系

1.2.1 实际 AI 应用的典型形态

实际 AI 应用是面向终端用户、具备完整交互逻辑与场景功能的产品,主要分为两类典型形态:

  1. 聊天类应用:如智能人工客服,核心能力是多轮对话交互与问题解答。
  2. 生成类应用:如豆包、DeepSeek 客户端,覆盖文本生成、图像生成、多模态创作等能力。

以图像生成为例,终端用户只需输入自然语言描述、选择风格与比例参数,即可获得生成结果;产品层封装了参考图融合、多图拼接、模板匹配等复杂逻辑,用户无需感知底层模型的调用细节。

1.2.2 AI 应用调用模型的路径类比

AI 应用调用底层 AI 模型的过程可类比为 "过河":AI 模型位于河的对岸,AI 应用需要抵达对岸才能调用模型能力,存在两种通行方式:

  • 趟水过河:直接通过原生 API 调用 AI 模型,存在开发成本高、能力扩展难、流程封装复杂等问题,类比为 "打湿鞋子"。
  • 过桥过河:通过 LangChain 等开发框架间接调用模型,框架封装了底层调用逻辑、提供了丰富的扩展组件,类比为平稳通行的桥梁。

1.3 原生 API 调用模式:趟水过溪

1.3.1 DeepSeek 案例:应用与模型的分层

DeepSeek 客户端属于面向用户的 AI 应用,而非模型本身。客户端提供了对话交互、深度思考、联网搜索等产品化功能,其底层调用的是 DeepSeek 官方提供的大模型 API。开发者可直接通过 HTTP 接口原生调用模型能力,无需依赖第三方框架。

DeepSeek 开放 API 具备以下基础特性:

  • 接口格式与 OpenAI API 兼容,支持通过修改 base_url 适配现有 OpenAI 生态工具。
  • 官方主接口地址为https://api.deepseek.com,兼容格式地址为https://api.deepseek.com/v1,其中v1为接口版本标识,与模型版本无关。
  • 支持流式输出与非流式输出两种模式,通过stream参数控制。
  • 提供模型版本迭代、Token 用量统计、密钥管理、账单结算等配套能力。

1.3.2 原生 API 调用实现方式

原生调用基于 HTTP POST 请求实现,接口路径为/chat/completions,核心配置包含请求头与请求体两部分:

  1. 请求头(Headers)
    1. Content-Type: application/json:指定请求体格式为 JSON。
    2. Authorization: Bearer {api_key}:携带身份校验密钥,用于接口鉴权与用量统计。
  2. 请求体(Body)核心参数
    1. model:指定调用的模型名称,如deepseek-chat
    2. messages:对话消息列表,每条消息包含role(角色,如 user、assistant)与content(消息内容)字段。

以下为标准请求体示例:

json 复制代码
{
  "model": "deepseek-chat",
  "messages": [
    {
      "role": "user",
      "content": "你好,你是谁?"
    }
  ]
}

1.3.3 原生 API 返回结果结构

接口成功调用后返回 JSON 格式响应,核心字段包含:

  • id:本次请求的唯一标识。
  • object:返回对象类型,固定为chat.completion
  • created:请求时间戳。
  • model:实际响应的模型名称。
  • choices:模型生成结果列表,包含消息内容、结束原因等信息。
  • usage:Token 用量统计,包含提示词 Token 数、补全 Token 数与总 Token 数,同时支持缓存命中明细统计。

以下为标准返回结果示例:

json 复制代码
{
  "id": "3360d43b-7e38-4d02-b8b0-b1a5e345778f",
  "object": "chat.completion",
  "created": 1759984349,
  "model": "deepseek-chat",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "我是DeepSeek,由深度求索公司研发的人工智能助手。\n-支持联网搜索功能(需要手动开启)\n-没有语音功能,主要通过文字交流\n\n我很乐意为你解答问题、提供帮助,或者和你聊天!有什么我可以帮你的吗?"
      },
      "finish_reason": "stop",
      "logprobs": null
    }
  ],
  "usage": {
    "prompt_tokens": 8,
    "completion_tokens": 137,
    "total_tokens": 145,
    "prompt_tokens_details": {
      "cached_tokens": 0,
      "prompt_cache_hit_tokens": 0,
      "prompt_cache_miss_tokens": 8
    }
  }
}

批注

原笔记中存在多处拼写疏漏,如模型名写为残缺形式、接口域名拼写错误、字段名截断等,此处已按照 DeepSeek 官方 API 规范进行完整修正。原生 API 调用是直接与模型服务端交互的最底层方式,所有参数校验、结果解析、错误处理、多轮对话上下文维护均需开发者自行实现,这正是 "趟水过溪" 模式的核心成本来源。

1.3.4 原生 API 调用的核心问题

原生直接调用模型接口虽然最直接,但存在显著的局限性,对应 "打湿鞋子" 的问题:

  1. 开发效率低:需要手动处理请求封装、结果解析、异常重试、鉴权管理等大量重复逻辑。
  2. 能力扩展难:若要接入联网搜索、数据库查询、工具调用等能力,需开发者从零实现。
  3. 上下文管理复杂:多轮对话的记忆维护、长文本截断、Token 计数优化等工作无统一封装。
  4. 模型切换成本高:不同厂商 API 格式存在差异,切换模型时需要大幅修改调用逻辑。

1.4 LangChain 框架模式:走桥过溪

LangChain 是专门面向大模型应用开发的编程框架,其核心定位是替代原生 API 的裸调用方式,通过封装底层调用流程、提供标准化组件,降低 AI 应用的开发门槛与维护成本。

LangChain 的核心价值体现在三个层面:

  1. 底层封装:统一封装不同大模型厂商的 API 调用逻辑,提供一致的开发接口,大幅降低模型切换成本。
  2. 组件生态:内置记忆模块、检索模块、工具调用、链式流程编排等大量预制组件,开发者可直接复用,无需从零实现。
  3. 流程编排:支持通过链式结构、代理模式组织复杂的业务逻辑,实现多步骤、多工具协同的复杂 AI 任务。

简言之,LangChain 作为连接 AI 模型与实际 AI 应用的桥梁,让开发者无需关注底层调用细节,聚焦于业务逻辑本身的实现。

1.5 核心概念区分

必须明确区分 "AI 应用" 与 "原生 AI 模型" 两个概念:

  • 用户日常接触的豆包、DeepSeek 客户端等产品均属于AI 应用,而非模型本身。
  • AI 应用在底层模型的基础上,额外封装了大量产品逻辑(如界面交互、上下文管理、功能入口、业务规则等),并非对原生模型的简单透传。
  • 原生 AI 模型仅具备基础的文本理解与生成能力,不包含任何面向终端用户的产品化逻辑。

1.6 本节总结:LangChain 的定义

LangChain 本质是一座连接 AI 模型与 AI 应用的 "桥梁":它以编程方式指挥和协调大模型,能够对接数据库、搜索引擎、第三方 API 等整个软件生态,将大模型的基础能力转化为可解决复杂业务问题的实际应用。


2 ~> 宏观认识大模型

2.1 大模型的宏观理解

从宏观视角理解,大模型是通过训练海量互联网数据形成的人工智能模型,核心能力是理解并生成人类自然语言。可通过三个类比建立直观认知:

  1. 数字巨人:大模型训练阶段阅读了互联网中近乎全域的知识数据,具备极广的知识覆盖面,如同掌握海量信息的数字形态巨人。
  2. 人类大脑:大模型具备信息收集、语义理解、逻辑处理的能力,能够基于输入信息完成推理、创作、解答等复杂任务,承担着 AI 系统的 "大脑" 角色。
  3. 超级学霸:大模型能够整合海量知识资源,对各类概念进行归纳解释,对未知问题给出符合逻辑的解答,具备强大的知识整合与泛化能力。

2.2 大模型的核心能力

大模型的核心价值来源于两类基础能力:

  1. 泛化能力:无需针对特定任务单独训练,即可通过自然语言指令完成不同领域的任务,适配问答、写作、翻译、代码生成等多种场景。
  2. 逻辑推理能力:能够基于已知信息进行推导、分析与判断,处理具备因果关系、步骤依赖的复杂问题。

2.3 核心问题

大模型虽然具备强大的知识与推理能力,但存在天然的能力边界,这也是整个 AI 应用开发领域的核心命题:如何让大模型从一个 "知识百科全书",升级为能够行动、能够思考、能够深度融入业务流程的智能伙伴(Agent)

原生大模型存在三类核心短板:

  1. 缺乏 "眼睛":无法实时获取外部世界的最新信息,知识存在时效性边界,也无法直接读取业务系统数据。
  2. 缺乏 "手脚":无法主动执行操作、调用外部工具,只能输出文本结果,不能直接作用于现实系统。
  3. 缺乏 "长效记忆":单轮对话上下文长度有限,无法持久化存储业务信息与历史交互逻辑。

而 LangChain 的核心作用,正是为大模型补充上述能力:通过编程框架对接外部数据源、工具接口与记忆存储,让大模型具备感知世界、执行操作、沉淀记忆的能力,最终成为可融入业务流程的智能体。


3 ~> 大模型篇章的要点阐述

在正式学习 LangChain 之前,必须先建立扎实的大模型基础认知,核心包含三个学习目标:

  1. 深入理解大模型的工作原理与核心能力边界 掌握大模型的底层运行逻辑,明确其能做什么、不能做什么,避免对模型能力产生错误预期,是合理运用 LangChain 组件的前提。
  2. 清醒认识大模型的固有缺陷 重点掌握幻觉、知识时效性、逻辑严谨性边界等固有问题,了解缺陷产生的底层原因,才能在 LangChain 开发中通过合理设计规避或缓解缺陷。
  3. 建立问题翻译的思维框架 掌握将复杂业务问题拆解、转化为大模型能够理解与处理的语言的方法,这是后续设计 Prompt、编排 Chain 流程、开发 Agent 的核心基础能力。

LangChain 体系包含大量组件概念与设计模式,只有打好大模型底层认知基础,才能真正理解各组件的设计逻辑与适用场景,而非死记硬背 API 用法。


4 ~> 补充说明

大模型本身的能力也在持续演进,例如部分主流大模型产品已经逐步内置 Agent 能力、工具调用能力,原生大模型正在不断完善自身的固有缺陷。但 LangChain 等开发框架依然具备不可替代的价值:框架提供了更灵活的定制能力、更丰富的生态对接、更深度的业务流程控制力,是开发复杂企业级 AI 应用的主流选择。


总结

核心考点深度总结

本章作为 LangChain 学习的开篇,核心考点与易错点集中在认知概念、模式对比、边界定位三个维度,是后续技术学习的逻辑根基,需重点掌握以下内容:

  1. 核心概念辨析(高频易错点) 必须严格区分 AI 模型、开发框架、AI 应用三者的层级关系:AI 模型是底层能力底座,LangChain 是中间开发框架,AI 应用是面向用户的最终产品。常见误区是将客户端应用等同于模型本身 ------ 豆包、DeepSeek 客户端均属于 AI 应用,其底层调用了对应的大模型,且封装了大量产品层逻辑,并非模型本身。同时必须明确:LangChain 的本质是开发框架而非模型,它不生产模型能力,而是通过封装与编排放大模型的落地价值。
  2. 两种调用模式的对比(核心考点) 原生 API 调用(趟水过溪)与 LangChain 框架调用(走桥过溪)的差异是本章核心考点:
  • 原生 API 调用:优势是最底层、最灵活,无额外框架依赖;劣势是开发成本高、扩展能力弱、维护成本高,仅适合极简场景或底层性能优化场景。
  • LangChain 框架调用:优势是开发效率高、组件生态丰富、模型切换成本低、天然支持复杂流程编排;劣势是存在框架学习成本,底层调用逻辑被封装。 复习时需能够基于业务需求判断技术选型,明确两种模式的适用边界。
  1. 大模型能力边界与核心痛点(底层逻辑考点) 大模型的核心优势是泛化能力与逻辑推理能力,核心短板是缺乏实时感知、主动执行与长效记忆能力。这一短板是 LangChain 存在的核心价值来源,也是所有 Agent 开发的核心出发点。同时必须建立清晰认知:幻觉问题、知识时效性问题是大模型的固有缺陷,无法通过框架彻底消除,只能通过检索增强、工具调用等方式缓解,这一认知是后续 RAG、Agent 模块学习的重要前提。
  2. 学习路径逻辑(体系化考点) 先掌握大模型基础原理与边界,再学习 LangChain 组件与用法,是正确的学习路径。跳过底层认知直接学习 API 会导致只会调用、不会设计,无法应对复杂业务场景。整个课程的最终目标是实现 "可融入业务流程的智能体",所有 LangChain 组件的学习都应围绕这一最终目标展开,理解每个组件对应解决大模型的哪一项短板。
  3. API 细节易错点 DeepSeek 兼容接口地址中的v1是接口版本,与模型版本无关,属于常见认知误区。原生 API 调用中,Authorization 字段的 Bearer 前缀、Content-Type 的指定、messages 数组的角色格式,都是实际开发中的高频出错点,需精准掌握。同时 Token 用量统计包含缓存命中明细,这一特性是成本优化的重要依据,也是易被忽略的细节考点。

结尾

uu们,本文的内容到这里就全部结束了,艾莉丝在这里再次感谢您的阅读!

|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ### 艾莉丝努力练剑 C/C++ & Linux 底层探索者 | 一个正在努力练剑的技术博主 *** ** * ** *** 👀 【关注】 跟随我一起深耕技术领域,见证每一次成长。 ❤️ 【点赞】 让优质内容被更多人看见,让知识传递更有力量。 ⭐ 【收藏】 把核心知识点存好,在需要时随时查、随时用。 💬 【评论】 分享你的经验或疑问,评论区一起交流避坑! 不要忘记给博主"一键四连"哦! "今日练剑达成!" "技术之路难免有困惑,但同行的人会让前进更有方向。" |

结语:希望对学习Linux相关内容的uu有所帮助,不要忘记给博主"一键四连"哦!

🗡博主在这里放了一只小狗,大家看完了摸摸小狗放松一下吧!🗡 ૮₍ ˶ ˊ ᴥ ˋ˶₎ა