Hello-Agents 第一章 初识智能体 学习笔记

Hello-Agents 第一章 初识智能体 学习笔记

  1. 首先介绍了什么是智能体,也就是Agent,它和传统的智能体的区别在哪里。简单说,智能体就是一个能自己感知环境、自己动脑子、自己采取行动的东西
  2. 至于智能体的类型分类,暂时使用不上,我理解就是架构师选框架和技术一样,但是缺少具体的现实大模型类型,根本记不住,即使知道不同分类的作用,也无法映射到现实的大模型中去
  3. 智能体有个很重要的知识点,就是 感知-思考-行动,我理解就是Agent解决感知和行动,思考交给LLM
  4. 实现个简单的智能体,截图如下:

习题:

习题1 智能体判断与分类

case A:一台符合冯·诺依曼结构的超级计算机

  • 是否属于智能体? 否。
  • 理由:该计算机只是一台通用计算设备,不具备感知环境、自主决策和采取行动的能力。它被动执行预设程序,没有目标导向性,因此不符合智能体的定义。

case B:特斯拉自动驾驶系统

  • 是否属于智能体? 是。
  • 分类维度
    • 内部决策架构:基于模型的反射智能体。系统利用内部世界模型(如车辆动力学、道路结构)结合实时传感器数据,快速做出反应。
    • 时间与反应性:反应式智能体。决策需在毫秒级完成,强调即时响应。
    • 知识表示:亚符号主义为主。感知部分依赖深度学习(视觉识别),控制部分可能结合规则,但整体以神经网络为核心。
  • 理由:系统通过摄像头、雷达等传感器感知环境,自主决策刹车或变道,并通过执行器控制车辆,目标为安全行驶,符合智能体定义。

case C:AlphaGo

  • 是否属于智能体? 是。
  • 分类维度
    • 内部决策架构:基于目标的智能体(或基于效用)。通过蒙特卡洛树搜索评估未来走法,最大化获胜概率。
    • 时间与反应性:规划式智能体。对弈中需深入计算数十步,属于深思熟虑的规划。
    • 知识表示:神经符号混合。神经网络评估局面(亚符号),搜索树进行符号推理(符号)。
  • 理由:AlphaGo感知棋盘状态,自主规划最优落子,通过落子动作改变环境(棋盘),以获胜为目标,是典型的智能体。

case D:ChatGPT扮演的智能客服

  • 是否属于智能体? 是。
  • 分类维度
    • 内部决策架构:LLM驱动的智能体。利用大语言模型的推理能力分解任务、调用工具(如查询订单)、生成回答。
    • 时间与反应性:混合式智能体。既需对用户即时反馈(反应性),也需多步规划(如先查订单再分析原因)。
    • 知识表示:神经符号混合。核心为神经网络,但通过提示生成结构化思维链,模拟符号推理。
  • 理由:系统感知用户输入(文本),通过LLM推理,输出回复(行动),以解决问题为目标,具备自主性。

习题2 智能健身教练的PEAS描述与环境特性

PEAS模型描述
维度 内容
性能度量 心率监测准确率、运动计划达成率、用户满意度、动作纠正正确率、训练效果(如减脂/增肌进度)、安全性(避免过度训练)
环境 用户的身体状态(心率、运动强度、疲劳度)、运动场景(室内/户外)、可穿戴设备数据、用户语音/文本反馈、历史训练记录
执行器 语音播报(指导、鼓励、纠正)、屏幕显示(训练计划、视频示范)、可调整设备阻力(如智能跑步机)、发送饮食建议通知
传感器 可穿戴设备(心率带、智能手表)、摄像头(动作捕捉)、麦克风(语音指令)、触摸屏(用户输入)
环境特性分析
  • 部分可观察:无法直接感知用户的肌肉疲劳、心理状态等,只能通过心率、动作等间接推断。
  • 随机性:用户反应不确定(如突然停下、改变动作),传感器数据存在噪声。
  • 动态性:用户状态实时变化(心率波动),环境可能变化(如户外天气影响)。
  • 序贯性:当前训练动作影响后续疲劳度和计划调整。
  • 多智能体:可能与其他健康应用、社交平台交互(如分享成绩),或存在多个用户同时使用。

习题3 电商退款处理方案比较

方案A(Workflow)与方案B(Agent)优缺点对比
方案 优点 缺点
Workflow 规则明确,易于实现和审计;处理速度快;成本低;适用于标准化场景 僵化,无法处理复杂或例外情况;用户个性化体验差;可能误判(如恶意退款与真实问题难以区分)
Agent 灵活,能处理复杂、多变情形;可结合用户历史行为进行个性化决策;提升用户体验 决策过程不透明,难以解释;可能产生错误(幻觉);需要大量训练数据和算力;存在安全风险
适用场景
  • Workflow更合适:小额、标准化的退款(如7天内无理由退款),规则清晰且风险低,追求效率。
  • Agent更有优势:大额退款、特殊商品(定制、易损)、涉及复杂纠纷(如用户多次投诉),需要综合判断。
方案C:混合模式
  • 思路:采用分级处理。先用Workflow自动处理常规情况(如金额<500元且符合政策),若触发异常条件(如金额过高、用户历史行为可疑)则转交Agent进行深度分析,Agent可提供建议并最终由人工审核。这样既保持效率,又增强灵活性,同时保留人工干预通道,降低风险。

习题4 智能旅行助手功能扩展思路

1. 添加"记忆"功能
  • 思路:维护一个用户偏好数据库(如JSON文件或内存字典),存储用户的历史偏好(如喜欢历史文化、预算范围)。在每次交互开始时,将记忆内容作为系统提示的一部分注入,或在每次思考时让智能体查询记忆。
  • 修改循环 :在prompt_history中加入记忆摘要,例如"用户偏好:历史文化景点,预算500元以内"。每次行动后,可让智能体更新记忆(如通过update_memory工具)。
2. 自动推荐备选方案
  • 思路 :当工具调用返回"门票售罄"等信息时,智能体应识别为失败,并重新规划。可在Observation中检测特定关键词,然后强制让智能体再次思考,选择其他景点或调整查询条件。
  • 修改循环 :在解析Observation后,若包含"售罄"等词,可追加一条提示"推荐失败,请尝试其他景点",然后继续循环。
3. 反思并调整推荐策略
  • 思路:记录用户连续拒绝次数,当达到阈值(如3次)时,触发反思步骤。可在Prompt中加入"如果用户连续拒绝,请反思可能原因(如推荐类型不符、价格问题)并调整策略"。
  • 修改循环 :在prompt_history中记录拒绝次数,并在下一次循环前添加系统消息"用户已拒绝前3次推荐,请反思并尝试不同风格的景点"。智能体应输出反思内容(如Thought中包含分析),然后调整行动。

习题5 双系统理论在医疗诊断助手中的应用

应用场景:智能医疗诊断助手
  • 系统1(快速直觉):处理常见病症的初步筛查。例如,根据患者描述的发热、咳嗽、流涕等症状,快速匹配感冒、流感等常见病,给出初步建议(如多喝水、休息)。系统1基于深度学习模型,从海量病例中学习模式,响应速度快。
  • 系统2(慢速推理):处理复杂或罕见病例。当症状模糊、多种疾病可能重叠,或系统1置信度低时,系统2启动。它调用医学知识库,检索相关文献,分析检查报告,进行逻辑推理,生成鉴别诊断列表,并建议进一步检查。系统2可能结合符号推理(如规则引擎)和知识图谱。
  • 协同工作
    1. 患者输入症状,系统1快速给出初步判断和置信度。
    2. 若置信度高且无危险信号,直接输出建议。
    3. 若置信度低或症状复杂,系统2介入,进行深度分析,可能要求患者补充信息,最终给出更精准的诊断和下一步方案。
    4. 系统2也可验证系统1的结果,例如当系统1误判时,系统2通过推理纠正。
    5. 整个过程中,系统1负责直觉感知,系统2负责理性验证,实现高效与准确的平衡。

习题6 智能体局限分析

1. 为什么智能体有时会产生"幻觉"?
  • 原因
    • LLM基于统计生成,缺乏真实世界知识,可能编造事实以符合上下文。
    • 训练数据包含错误或矛盾信息,模型学习了噪声。
    • 模型追求流畅性而非准确性,尤其在信息不足时倾向于补全。
    • 提示工程不当,未明确要求基于事实或引用来源。
2. 无循环限制可能陷入什么问题?
  • 可能问题
    • 无限循环:反复调用同一工具而不推进任务(如不断查询天气但无后续)。
    • 决策震荡:在几个行动间来回切换,无法收敛。
    • 资源耗尽:无限调用API导致成本激增或系统崩溃。
    • 逻辑死锁:因信息不足或矛盾而无法继续,但又不结束。
3. 如何评估智能体的"智能"程度?仅用准确率是否足够?
  • 评估维度
    • 任务完成率:成功达成目标的比例。
    • 效率:完成任务所需的步骤、时间、资源消耗。
    • 鲁棒性:应对异常、噪声输入的能力。
    • 可解释性:决策过程是否透明,能否给出理由。
    • 用户满意度:交互体验、结果是否符合预期。
    • 泛化能力:处理未见过任务的能力。
    • 安全性:避免有害行为。
  • 准确率不足:准确率仅反映最终输出与标准答案的匹配,但无法衡量智能体的规划、推理、工具使用等过程性能力,也无法反映其在动态环境中的适应能力。因此需结合多维度综合评估。

课程参考来源:hello-agents

相关推荐
爱看科技2 小时前
微美全息(NASDAQ:WIMI)协同量子生成网络架构:为量子生成对抗学习铺就优化通途
网络·学习·架构
泯仲2 小时前
从零起步学习MySQL 第十三章:MySQL 事务详解:原理、特性、并发问题与隔离级别
数据库·学习·mysql
式5162 小时前
CUDA编程学习(五)线程模型定义、矩阵相加
学习·算法·矩阵
次旅行的库2 小时前
【问渠哪得清如许-数据分析】学习笔记-上
数据库·笔记·sql·学习·postgresql·数据分析
云边散步2 小时前
godot2D游戏教程系列二(16)
笔记·学习·音视频
不灭锦鲤2 小时前
网络安全学习第50天(文件包含)更新
学习
微露清风3 小时前
系统性学习Linux-第八讲-进程间通信
java·linux·学习
ID_180079054733 小时前
python采集小红书笔记详情API接口,json数据返回
笔记·python·json
Be for thing3 小时前
Android 传感器硬件原理 + 功耗测试与异常定位实战(手表 / IoT / 手机通用)
android·学习·智能手机