OpenClaw / clawdbot 是什么?看懂 Agent 体系

🔥 个人主页: 杨利杰YJlio

❄️ 个人专栏: 《Windows 疑难杂症与工单复盘案例库》 《Sysinternals实战教程》

《WINDOWS教程》 《Windows PowerShell 实战》 《IOS插件分析测试》

《超简单:用Python让Excel飞起来》

🌟 让复杂的事情更简单,让重复的工作自动化

OpenClaw / clawdbot 是什么?看懂 Agent 体系

前言

  最近很多人看到 OpenClaw、clawdbot、Skills、MCP、RAG、Memory、AI Agent 这些词时,会觉得它们都和 AI 应用有关,但又分不清它们到底是什么关系。

  这篇文章按照视频里的图示逻辑重新拆开讲。先看整体关系,再看大模型、HTTP 请求、上下文窗口、Memory、RAG、工具调用、MCP、Skills,最后再回到 OpenClaw / clawdbot 到底应该放在哪一层理解。

  先给结论:OpenClaw / clawdbot 更像一个 AI Agent 产品形态。它不是单独的新模型,也不是单独的 RAG、Memory、MCP 或 Skills,而是把这些能力组合起来,用来完成更复杂的任务。

一、整体关系:这些概念不是同一层

  这张图是整篇文章的入口。图中把 Skills、RAG、LLM、MCP、Memory 放在同一个体系里,目的是说明这些概念不是同一层的东西。

  LLM,也就是大模型,负责理解、推理和生成。Memory 负责记忆。RAG 负责从外部知识库检索资料。MCP 负责让模型按标准方式调用工具。Skills 负责告诉模型遇到任务时应该按什么步骤做。

  所以这些概念不是互相替代的关系,而是组合关系。一个完整的 Agent 系统,往往会同时用到它们。

概念 主要作用 可以这样理解
LLM / 大模型 理解、推理、生成内容 AI 的能力底座
Memory 保存和取回历史信息 让系统记住用户和任务背景
RAG 检索外部资料 让模型回答时有资料依据
MCP 标准化工具调用 让模型能连接外部工具
Skills 规定任务步骤和操作规范 让模型按流程做事
AI Agent 组合多种能力执行任务 从聊天走向执行
OpenClaw / clawdbot Agent 产品形态 把上述能力组织成可用产品

  理解这套体系时,先不要急着问"谁取代谁"。更准确的问法是:它们分别负责哪一层,最后怎么组合成一个能执行任务的系统。

二、大模型只是能力来源,不等于完整应用

  这张图讲的是大模型本身。视频里把大模型类比成一个模型文件,例如 gpt-4.bin、deepseek-v3.bin。这个说法不是在强调真实部署一定长这样,而是为了说明:模型本身只是能力来源。

  用户平时使用 AI 产品时,不会直接打开这个模型文件。真正对外提供服务的是推理服务。用户把问题发给服务端,服务端调用模型推理,再把回答返回给用户。

  因此,大模型只解决了一部分问题。它能理解和生成内容,但完整应用还要处理上下文、记忆、检索、工具调用、权限和执行环境。

三、HTTP 请求默认无状态,模型不会天然记住上文

  这张图对应 HTTP 推理服务。用户每次发起请求,服务端接收请求后调用模型,然后返回结果。

  问题在于,HTTP 请求本身是一条一条来的。第一次请求可能被服务器 A 处理,第二次请求可能被服务器 B 处理。如果系统不额外保存历史,模型只会看到当前请求,不会自动知道前面聊过什么。

  所以对话系统通常会把历史消息重新拼进当前请求里。用户继续提问时,系统会把前面的对话内容一起带给模型,让模型基于完整上下文继续回答。

四、上下文窗口有限,历史不能无限塞进去

  这张图展示的是"历史消息太长"的问题。把历史对话重新放进请求里,可以让模型理解上下文,但上下文窗口不是无限的。

  对话越长,历史消息越多。如果全部塞进模型请求,最后会超过上下文窗口。超过以后,系统只能截断一部分内容,或者把历史压缩成摘要。

  这也是为什么很多 AI 产品会引入 Memory。它的目的不是让模型文件永久改变,而是帮助系统管理哪些历史信息值得保留,哪些信息在当前任务里需要重新取出来。

五、Memory:长期记忆和短期记忆

  这张图对应 Memory,也就是记忆。图里把记忆分成长期记忆和短期记忆。

  短期记忆通常和当前会话有关,比如刚才问了什么、任务做到哪一步、当前上下文里有哪些限制条件。长期记忆则更偏跨会话的信息,比如用户偏好、长期项目背景、经常使用的工作方式等。

  Memory 的工作方式可以理解为:系统先保存一部分有价值的信息,需要时再把相关记忆取出来,放回当前请求上下文。模型看到这些信息后,才表现得像"记得"。

  这里要注意,Memory 不等于模型训练。它通常不会改变模型参数,而是在推理前给模型补充上下文。

六、大模型知识固定,外部知识需要额外接入

  这张图讲的是大模型知识边界。画面里写着"去年的数据"和"知识就固定了",意思是:模型训练完成后,它内部的知识基本固定。

  这类模型不一定知道公司最新制度、项目最新文档、数据库实时记录,也不一定知道本地文件里的内容。如果只靠模型原始知识,它可能回答不准。

  尤其是在企业文档、内部系统、私有知识库、代码库、日志分析这些场景里,模型必须先拿到外部资料,才能基于资料回答。

七、外部知识库与检索服务

  这张图对应外部知识库和检索服务。用户提出问题后,系统不是直接让模型凭空回答,而是先通过检索服务去外部知识库中查找相关内容。

  外部知识库可以是企业文档、网页资料、内部知识平台、代码仓库,也可以是数据库或向量库。检索服务负责从这些资料中找到与问题相关的部分。

  检索到的内容会被放进模型上下文里,再交给模型生成回答。

  这张图强调的是,外部资料不一定非得是向量数据库。传统数据库同样可以作为资料来源。

  比如企业内部系统里的工单记录、资产信息、合同数据、运维日志,都可能存放在传统数据库中。AI 系统可以通过检索服务或接口查询这些数据,再把查询结果交给模型分析。

  所以不要把 RAG 简单理解成"向量数据库"。向量检索只是常见实现方式之一,真正重要的是"回答前先检索资料"。

八、RAG:检索增强生成

  这张图正式对应 RAG。RAG 的英文是 Retrieval Augmented Generation,中文一般叫检索增强生成。

  它的核心流程很清楚:用户提问后,系统先检索外部知识库,找到相关资料,然后把资料交给模型,模型再基于资料生成回答。

步骤 系统动作 目的
第一步 根据用户问题检索资料 找到可参考内容
第二步 把资料放入模型上下文 让模型看到外部知识
第三步 模型基于资料生成回答 减少凭空回答和知识过期问题

  RAG 解决的是"模型如何获取外部知识"的问题。它不是记忆系统,也不是工具协议。

九、Memory 和 RAG 组合

  这张图把 Memory、RAG 和推理服务放在一起,说明它们可以同时进入模型上下文。

  Memory 更关注用户历史和任务背景,例如用户偏好、当前会话进度、之前确认过的约束条件。RAG 更关注外部知识,例如文档、数据库、知识库、日志和接口数据。

对比项 Memory RAG
信息来源 用户历史、会话记录、任务背景 文档库、数据库、知识库、外部系统
主要用途 记住用户和任务上下文 检索外部资料
典型问题 你还记得我之前说过什么吗 资料库里有没有相关内容
是否改变模型本体 不改变 不改变

  实际 Agent 系统里,系统可能先取 Memory,了解用户背景;再用 RAG 查外部资料;最后把两类信息一起交给大模型处理。

十、工具调用:模型要把回答变成动作

  这张图讲的是工具调用。大模型有时不只是回答问题,还需要执行动作。例如发送邮件、读取文件、查询接口、操作系统、访问数据库、分析日志等。

  模型本身不会直接去操作外部系统。它通常会生成一个结构化工具调用请求。图中展示的就是类似 JSON 的调用结构,里面包含工具名和参数。

  比如模型判断当前任务需要发邮件,就会生成 send_email 之类的工具调用请求,并带上收件人、主题、正文等参数。真正执行动作的是外部工具或服务。

  这张图对应工具执行后的返回流程。外部服务执行完成后,把结果返回给模型。模型再根据执行结果生成最终回复。

  所以工具调用的分工是:模型负责判断该做什么,工具负责真正执行,执行结果再回到模型。这样 AI 才能从"说话"进一步变成"做事"。

十一、MCP Host:承接模型侧的工具调用

  这张图讲的是 MCP Host。MCP 可以理解成一种标准化协议,用来规范模型和工具之间的通信方式。

  当模型生成工具调用请求后,MCP Host 负责承接这些请求,并把它们按照 MCP 协议转给后面的工具系统。

  MCP 的重点不是让模型本身变强,而是让模型调用工具的方式更统一、更容易扩展。

十二、MCP Client / Server / 插件

  这张图对应 MCP 的本地、网络和远端插件结构。可以把 MCP 分成几个角色来看:

角色 作用
MCP Host 承接模型侧工具调用请求
MCP Client 按 MCP 协议发起连接和调用
MCP Server 暴露具体工具能力
MCP 插件 连接文件、接口、数据库、浏览器等外部能力

  有了 MCP,模型可以通过相对统一的方式连接不同工具,而不是每接一个工具就重新写一套调用规则。

十三、RAG、Memory、MCP 可以组合使用

  这张图讲的是 RAG、Memory、MCP 的组合。实际 Agent 系统里,这几类能力不会孤立存在。

  例如用户让 AI 分析一个项目问题,系统可能先通过 Memory 取出用户的项目背景,再通过 RAG 检索相关文档,接着通过 MCP 调用工具读取文件或查询接口,最后由大模型整理分析结果。

  这也是为什么现在很多 Agent 产品会同时提到这些概念。它们是同一套执行系统里的不同部件。

十四、Skills:结构化操作指南

  这张图对应 Skills。Skills 和 MCP 经常一起出现,但它们解决的问题不同。

  MCP 负责"怎么调用工具"。Skills 负责"遇到任务应该按什么步骤做"。

  可以把 Skills 理解成结构化操作指南。它会告诉模型:遇到某类任务时先做什么,再做什么,什么时候查资料,什么时候调用工具,什么时候停止。

  这张图用"排查问题"举例。排查问题不能只靠模型随便猜,而是应该按步骤执行。

  例如先看日志,再看配置,再定位模块,必要时通过 MCP 插件读取文件、查询系统或调用接口。这样模型执行任务时才更稳定。

十五、大模型、Skills、MCP、插件的顺序

  这张图把大模型、Skills、MCP 协议和 MCP 插件放到同一条链路里。

  比较清晰的理解顺序是:大模型负责理解任务;Skills 提供操作步骤;MCP 协议负责标准化通信;MCP 插件连接具体工具。

环节 负责内容
大模型 理解用户意图,判断下一步
Skills 提供任务流程和注意事项
MCP 协议 规范工具调用通信方式
MCP 插件 执行具体工具能力

  如果没有 Skills,模型可能知道可以调用工具,但不一定知道应该按什么顺序做。如果没有 MCP,Skills 里写了要调用工具,也缺少统一的执行通道。

十六、AI Agent:这些能力组合后的系统形态

  AI Agent 的重点不是"模型会聊天",而是"系统能围绕任务持续推进"。它可以理解用户目标,拆解步骤,查资料,调用工具,拿到结果,再继续下一步。

  从结构上看,Agent 通常不是单一能力,而是把大模型、Memory、RAG、MCP、Skills、插件和执行环境组合起来。大模型负责判断,Memory 和 RAG 负责补充上下文,MCP 和插件负责连接工具,Skills 负责给出操作流程。

  所以 Agent 不是某一个单独工具,而是一组能力组合后的系统形态。本节不再重复插入整体架构图,避免和第一节重复。

十七、AI Agent 与 clawdbot

  这张图把 clawdbot 放到了 AI Agent 的位置上,这是理解 OpenClaw / clawdbot 的关键。

  OpenClaw / clawdbot 不是一个单独的新模型,也不是单独的 RAG、Memory、MCP 或 Skills。它更像一个把这些能力组织到一起的 Agent 产品。

  它的重点在于:让用户通过自然语言提出任务,然后由系统结合大模型、记忆、外部知识、工具调用和执行环境,把任务一步步推进下去。

  这张图强调的是,clawdbot 不一定代表底层技术出现了绝对突破。它更像是把现有能力组合成了一个可用的产品形态。

  这类产品的价值不能只看模型,还要看任务编排、工具接入、执行环境、权限控制、稳定性和安全边界。

十八、和 Manus 的相似点:远端执行环境

  这张图把 clawdbot 和 Manus 做了类比。相似点在于,它们都涉及远端服务器或远端虚拟机式的执行环境。

  远端执行环境的好处是,Agent 可以在隔离环境里访问网页、运行工具、处理文件、调用服务。用户不需要把所有执行能力都放在本地。

  但这里必须关注安全问题。只要一个 Agent 能读取文件、访问系统、调用接口,就要考虑权限控制、数据隔离、日志审计和敏感信息保护。

十九、最后再压缩成一句话

  把整套关系压缩一下,可以这样记:

概念 一句话理解
大模型 负责理解和生成
Memory 负责记住用户和任务背景
RAG 负责从外部资料中检索内容
MCP 负责标准化工具调用
Skills 负责规定任务步骤
AI Agent 负责把这些能力组合起来执行任务
OpenClaw / clawdbot 更像一个 Agent 产品形态

  理解 OpenClaw / clawdbot,不要只盯着"它是不是新模型"。更准确的看法是:它把大模型、Memory、RAG、MCP、Skills、工具插件和执行环境组合起来,形成一个能够执行复杂任务的 Agent 系统。

  真正需要评估的,也不是某一个概念听起来多新,而是这套组合是否稳定、是否可控、权限边界是否清楚、数据是否安全、任务执行效果是否可靠。

二十、视频结尾转发提示

  如果只是想快速记忆,可以把这篇文章的关系记成一条线:大模型负责生成,Memory 负责记忆,RAG 负责查资料,MCP 负责调工具,Skills 负责定步骤,Agent 负责把这些能力组合起来做任务。

点击回到顶部

相关推荐
SamDeepThinking1 小时前
一条UPDATE语句在MySQL 8.0中到底加了几把锁?
后端·mysql·程序员
CodeSheep1 小时前
他俩只靠写代码,登上了胡润财富榜!
前端·后端·程序员
IT_陈寒1 小时前
React状态更新总是慢半拍?你可能忘了这个默认行为
前端·人工智能·后端
candyTong2 小时前
阿里开源 AI Code Review 工具:ocr review 的执行链路解析
javascript·后端·架构
铁皮饭盒2 小时前
TypeBox 比 Zod.js 校验 快10倍, 还兼容AI 工具调用, 他做对了什么?
前端·javascript·后端
倔强的石头_11 小时前
WorkBuddy 上手实战:打造一个可用的本地 AI 工作台
后端
Bigger11 小时前
Tauri (26)——托盘图标总对不上系统主题?一行 Template Image 搞定
前端·rust·app
kyriewen13 小时前
面试官问你:“AI 能写 80% 的代码了,公司为什么还需要你?”
前端·javascript·面试
甲维斯14 小时前
又升级咯!坦克大战2026,科技与复古并存!
前端·人工智能·游戏开发