初识智能体 Part 2:智能体的决策架构与认知模型

在上篇中,我们探讨了智能体的本质定义及其从"规则驱动"到"大模型驱动"的演进。本篇将深入剖析智能体的分类体系,并利用 PEAS 模型对任务环境进行精确规约。

1.1.3 智能体的类型

(1) 基于内部决策架构的分类

第一种分类维度是依据智能体内部决策架构的复杂程度。传统智能体的演进路径本身就构成了最经典的分类阶梯:从简单的反应式智能体,到引入内部模型的模型式智能体,再到更具前瞻性的基于目标和基于效用的智能体 。

(2) 基于时间与反应性的分类

除了内部架构的复杂性,还可以从智能体处理决策的时间维度进行分类。这个视角揭示了智能体设计中一个核心权衡:追求速度的反应性 (Reactivity) 与追求最优解的规划性 (Deliberation) 之间的平衡 。

下图展示了两者在决策时间与决策质量上的关系:

  • 反应式智能体 (Reactive Agents)

    • 特点:对环境刺激做出近乎即时的响应,决策延迟极低。遵循从感知到行动的直接映射。
    • 优势:速度快、计算开销低。适用于车辆安全气囊、高频交易等场景。
    • 代价:"短视"。由于缺乏长远规划,容易陷入局部最优,难以完成需要多步骤协调的复杂任务。
  • 规划式智能体 (Deliberative Agents)

    • 特点:在行动前会利用内部世界模型,系统地探索未来的各种可能性,评估不同行动序列的后果。
    • 优势:决策具有战略性和远见。适用于制定商业计划或规划长途旅行。
    • 代价:高昂的时间和计算成本。在瞬息万变的环境中,可能因思考过久而错过行动时机。
  • 混合式智能体 (Hybrid Agents)

    • 定义:结合两者的优点,实现反应与规划的平衡。
    • 现代 LLM 智能体模式:通常在一个"思考-行动-观察"的循环中运作,巧妙地将两种模式融为一体:
    • 规划 (Reasoning):在"思考"阶段,LLM 分析状况并规划下一步。这是一个审议过程。
    • 反应 (Acting & Observing):在"行动"和"观察"阶段,智能体与工具交互并获得反馈。这是一个反应过程。

(3) 基于知识表示的分类

这是一个更根本的分类维度,它探究智能体用以决策的知识,究竟是以何种形式存于其"思想"之中 。

  • 符号主义 AI (Symbolic AI)

    • 核心信念:智能源于对符号(如词语、概念)的逻辑操作。
    • 比喻:"一丝不苟的图书管理员",将知识整理为规则库和知识图谱。
    • 优势:透明、可解释。决策过程可完整追溯。
    • 缺陷:脆弱性与"知识获取瓶颈"。难以应对模糊和例外的现实世界。
  • 亚符号主义 AI (Sub-symbolic AI)

    • 核心信念:知识内隐地分布在神经网络中,是从海量数据中学习到的统计模式。
    • 比喻:"牙牙学语的孩童",通过看成千上万张图来辨识"猫"的视觉模式,而非学习规则。
    • 优势:强大的模式识别能力,对噪声数据鲁棒。
    • 缺陷:黑箱 (Black Box) 与不透明性。难以解释"为什么",且可能产生幻觉。
  • 神经符号主义 AI (Neuro-Symbolic AI)

    • 目标:融合两大范式,创造既能从数据学习又能进行逻辑推理的混合智能体。
    • 理论支撑 :丹尼尔·卡尼曼的《思考,快与慢》双系统理论。
      • 系统 1:快速、直觉、并行(类似于亚符号主义)。
      • 系统 2:缓慢、有条理、逻辑审慎(类似于符号主义)。

LLM 实践:LLM 智能体是神经符号主义的极佳实践。其内核(神经网络)提供模式识别(系统 1),而通过生成结构化的"思想、计划" (Chain of Thought),实现了逻辑推理(系统 2)。

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用 PEAS 模型 来精确描述一个任务环境 。

PEAS 模型详解(以智能旅行助手为例)

下表展示了如何运用 PEAS 模型对智能旅行助手进行规约 :

维度 描述
Performance (性能度量) 在预算和时间内,最大化用户满意度与行程合理性
Environment (环境) 航旅预订网站、地图服务、天气预报 API 等网络服务
Actuators (执行器) 调用 API 的函数、向用户界面生成和显示格式化文本
Sensors (传感器) 解析 API 返回的数据 (如 JSON, HTML)、读取用户输入的自然语言
现代 LLM 智能体环境的复杂特性

在实践中,LLM 智能体所处的数字环境展现出若干复杂特性,直接影响设计 :

  1. 部分可观察 (Partially Observable)

    智能体无法一次性获取全貌。例如,无法一次性拉取所有航司的所有数据,必须具备记忆 (记住已查过的)和探索(尝试不同日期)的能力。

  2. 随机性 (Stochastic)

    行动结果不确定。例如,两次查询机票,价格和余票可能不同。智能体必须具备处理不确定性、监控变化的能力。

  3. 多智能体 (Multi-agent)

    环境中存在其他行动者(如其他用户的抢票行为、航司的动态调价系统)。这要求智能体能快速响应。

  4. 序贯且动态 (Sequential & Dynamic)

    • 序贯:当前动作影响未来。
    • 动态:环境自身在变化。智能体的"感知-思考-行动-观察"循环必须快速适应。
相关推荐
晚霞的不甘18 小时前
CANN 编译器深度解析:UB、L1 与 Global Memory 的协同调度机制
java·后端·spring·架构·音视频
C澒18 小时前
前端分层架构实战:DDD 与 Clean Architecture 在大型业务系统中的落地路径与项目实践
前端·架构·系统架构·前端框架
Re.不晚18 小时前
MySQL进阶之战——索引、事务与锁、高可用架构的三重奏
数据库·mysql·架构
松☆18 小时前
深入理解CANN:面向AI加速的异构计算架构
人工智能·架构
麦聪聊数据19 小时前
为何通用堡垒机无法在数据库运维中实现精准风控?
数据库·sql·安全·低代码·架构
2的n次方_19 小时前
CANN Ascend C 编程语言深度解析:异构并行架构、显式存储层级与指令级精细化控制机制
c语言·开发语言·架构
L、21819 小时前
深入理解CANN:面向AI加速的异构计算架构详解
人工智能·架构
Max_uuc21 小时前
【架构心法】嵌入式系统的“防御性编程”:如何构建一个在灾难中存活的系统
架构
lbb 小魔仙21 小时前
面向 NPU 的高性能矩阵乘法:CANN ops-nn 算子库架构与优化技术
线性代数·矩阵·架构
是码龙不是码农1 天前
支付防重复下单|5 种幂等性设计方案(从初级到架构级)
java·架构·幂等性