LLM·Agent

文章目录

Agent:智能体

  • 简单来说,LLM只能输出文本内容,不能改变环境(帮你做事),也不能感知环境的变化(感知事情是否完成)
  • Agent:源自强化学习,能够感知和改变环境

ReAct:推理-执行架构

执行流程:

  • 用户首先提交任务,然后LLM进行思考并输出应该做的行动;
  • Agent程序负责接受LLM的请求然后调用对应的工具(实现上为python函数或者API接口),返回观察结果
  • 用户的提示词+思考过程+返回的结果都会被传入LLM作为上下文(堆叠上下文的方式),然后LLM又会输出新的执行。
  • 知道LLM知道任务已经完成,返回最终答案。


Plan-Act:规划-执行架构

  • Plan模型负责首先提出一个朴素但完整的计划
  • 执行Agent负责执行这个计划中的特定步骤,然后返回一个观察
  • Agent主程序拼接用户输入+上一次输入的计划+上一次输出的观察输入给Re-Plan模型
  • Replan模型会更新新的计划:删除已经完成的部分 ,对剩余计划进行进一步细化或者修改。
  • 重复此流程。

    执行流程:

Function Calling:输出格式约定

  • 本质就是特殊的提示词,要约定LLM的输出格式,方便解析LLM的输出并且调用工具
  • LLM擅长角色扮演和指令追随,Agent程序负责协调LLM的输出并真正参与调用工具 ,因此需要格式化LLM的输出,这是通过系统提示词约束的来的。

MCP:模型上下文协议

MCP Host

  • MCP主机,简单来说就是一个智能体
  • 本质是一个支持MCP协议的软件。

MCPServer和Tool

  • MCPServer:MCP服务提供商,就是一个python程序 ,程序提供了多个功能,又称之为tool

区分

Function Calling vs MCP

  • 前者约定LLM输出格式 ,后者约定LLM如何调用工具

RAG

LangChain:程序化开发流程

Workflow:非程序化开发流程

SKILL:Tool+说明文档

  • 已有的程序和说明文档在对话前传入Agent
  • 相当于把提示词换一个地方存起来,用于一个固定位置的文档说明

Context Engineering:上下文工程

Context Compression


Sub-Agent:子智能体

  • 将繁杂的任务模块化,分为多个subagent,subagent之间的上下文是不影响的
  • 最终将subagent的处理结果汇集给agent,用于完成最终的任务。
  • 优势:LLM没有记忆,如果直接用agent完成繁杂的任务很可能token损耗过多,上下文窗口过大,但是如果使用subagent,agent的上下文只有最重要的结果部分,可以节省上下文

Memory


记忆的检索:RAG / 语义嵌入匹配


记忆的失败案例:光说不练

  • 没有写入memory/*文件夹下

HEARTBEAT:心跳机制

  • 简单来说就是单独写一段prompt,让Agent在指定阶段将prompt传入给LLM作出一些事情出来

Crob Job系统

uv环境

uv中tool的概念

  • uvx=uvx tool run:临时将某个tool加载到隔离的虚拟环境中并且运行。
  • uvx tool install:将tool及其依赖安装到隔离的环境中,与pip install不同。

OpenClaw 安装步骤

系统信息

  • ubuntu22.04
  • 公共服务器:无sudo权限

安装过程

无sudo命令安装node.js 24

  • 使用wget命令下载预编译包 ,然后解压缩得到二进制包,可以直接使用。

  • 对于~/.bashrc:文件

python 复制代码
export PATH=/home/a2023102747/node-v24.14.0-linux-x64/bin:$PATH
相关推荐
字节架构前端17 小时前
Life of a Token:像调试代码一样看懂大模型如何生成 Token
人工智能·aigc·openai
七夜zippoe17 小时前
基于Rokid AI Glasses的「社交眼」:面向社交障碍人群的实时情绪辅助智能体开发实践
人工智能·情绪识别·智能体·眼镜·rokid
弹简特17 小时前
【AI辅助趣学SpringAI】03-聊天模型之SSE流式编程
人工智能·sse·springai
传说故事17 小时前
【论文阅读】RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis
论文阅读·人工智能·具身智能
桌面运维家17 小时前
IDV云桌面vDisk机房建设方案如何查看分组使用统计
大数据·人工智能
前端摸鱼匠17 小时前
【AI大模型春招面试题25】掩码自注意力(Masked Self-Attention)与普通自注意力的区别?适用场景?
人工智能·ai·面试·大模型·求职招聘
我是大聪明.18 小时前
RAG检索增强生成技术深度解析
人工智能
沫儿笙18 小时前
FANUC发那科机器人新能源车焊接节气装置
人工智能·机器人
2401_8322981018 小时前
OpenClaw云服务器优化技巧:降本50%,性能提升3倍
人工智能
王莎莎-MinerU18 小时前
MinerU + LangChain 实战:从 PDF 解析到 AI 问答全流程
人工智能·langchain·pdf·开源·产品运营·团队开发·个人开发