LLM·Agent

文章目录

Agent:智能体

  • 简单来说,LLM只能输出文本内容,不能改变环境(帮你做事),也不能感知环境的变化(感知事情是否完成)
  • Agent:源自强化学习,能够感知和改变环境

ReAct:推理-执行架构

执行流程:

  • 用户首先提交任务,然后LLM进行思考并输出应该做的行动;
  • Agent程序负责接受LLM的请求然后调用对应的工具(实现上为python函数或者API接口),返回观察结果
  • 用户的提示词+思考过程+返回的结果都会被传入LLM作为上下文(堆叠上下文的方式),然后LLM又会输出新的执行。
  • 知道LLM知道任务已经完成,返回最终答案。


Plan-Act:规划-执行架构

  • Plan模型负责首先提出一个朴素但完整的计划
  • 执行Agent负责执行这个计划中的特定步骤,然后返回一个观察
  • Agent主程序拼接用户输入+上一次输入的计划+上一次输出的观察输入给Re-Plan模型
  • Replan模型会更新新的计划:删除已经完成的部分 ,对剩余计划进行进一步细化或者修改。
  • 重复此流程。

    执行流程:

Function Calling:输出格式约定

  • 本质就是特殊的提示词,要约定LLM的输出格式,方便解析LLM的输出并且调用工具
  • LLM擅长角色扮演和指令追随,Agent程序负责协调LLM的输出并真正参与调用工具 ,因此需要格式化LLM的输出,这是通过系统提示词约束的来的。

MCP:模型上下文协议

MCP Host

  • MCP主机,简单来说就是一个智能体
  • 本质是一个支持MCP协议的软件。

MCPServer和Tool

  • MCPServer:MCP服务提供商,就是一个python程序 ,程序提供了多个功能,又称之为tool

区分

Function Calling vs MCP

  • 前者约定LLM输出格式 ,后者约定LLM如何调用工具

RAG

LangChain:程序化开发流程

Workflow:非程序化开发流程

SKILL:Tool+说明文档

  • 已有的程序和说明文档在对话前传入Agent
  • 相当于把提示词换一个地方存起来,用于一个固定位置的文档说明

Context Engineering:上下文工程

Context Compression


Sub-Agent:子智能体

  • 将繁杂的任务模块化,分为多个subagent,subagent之间的上下文是不影响的
  • 最终将subagent的处理结果汇集给agent,用于完成最终的任务。
  • 优势:LLM没有记忆,如果直接用agent完成繁杂的任务很可能token损耗过多,上下文窗口过大,但是如果使用subagent,agent的上下文只有最重要的结果部分,可以节省上下文

Memory


记忆的检索:RAG / 语义嵌入匹配


记忆的失败案例:光说不练

  • 没有写入memory/*文件夹下

HEARTBEAT:心跳机制

  • 简单来说就是单独写一段prompt,让Agent在指定阶段将prompt传入给LLM作出一些事情出来

Crob Job系统

uv环境

uv中tool的概念

  • uvx=uvx tool run:临时将某个tool加载到隔离的虚拟环境中并且运行。
  • uvx tool install:将tool及其依赖安装到隔离的环境中,与pip install不同。

OpenClaw 安装步骤

系统信息

  • ubuntu22.04
  • 公共服务器:无sudo权限

安装过程

无sudo命令安装node.js 24

  • 使用wget命令下载预编译包 ,然后解压缩得到二进制包,可以直接使用。

  • 对于~/.bashrc:文件

python 复制代码
export PATH=/home/a2023102747/node-v24.14.0-linux-x64/bin:$PATH
相关推荐
xinxiangwangzhi_1 小时前
立体匹配--深度学习方法综述(1)
人工智能·深度学习·计算机视觉
九河云1 小时前
数据上云的安全边界:零信任架构在混合云场景的应用
大数据·人工智能·安全·架构·数字化转型
wang_chao1181 小时前
目标检测基础概念
人工智能·目标检测·目标跟踪
啊阿狸不会拉杆1 小时前
《计算机视觉:模型、学习和推理》第 18 章-身份与方式模型
人工智能·python·学习·计算机视觉·分类·子空间身份模型·plda
程序大视界1 小时前
Mac电脑详细养小龙虾教程
人工智能·ai·openclaw
深小乐2 小时前
关于 AI,作为一名互联网人,聊聊我当下最真实的想法
人工智能
IT_陈寒2 小时前
Python开发者都在偷偷用的5个高效技巧,你竟然还不知道?
前端·人工智能·后端
DatGuy2 小时前
Week 37: 深度学习进阶:基于 OpenClaw 的多智能体协同架构
人工智能·深度学习·架构
程序员小明儿2 小时前
具身智能:为什么人形机器人是AI的终极形态?
人工智能·机器人