Hello-Agents 第一章初识智能体学习笔记

bestadc2026-03-17 10:07

Hello-Agents 第一章初识智能体学习笔记

首先介绍了什么是智能体，也就是Agent，它和传统的智能体的区别在哪里。简单说，智能体就是一个能自己感知环境、自己动脑子、自己采取行动的东西
至于智能体的类型分类，暂时使用不上，我理解就是架构师选框架和技术一样，但是缺少具体的现实大模型类型，根本记不住，即使知道不同分类的作用，也无法映射到现实的大模型中去
智能体有个很重要的知识点，就是感知-思考-行动，我理解就是Agent解决感知和行动，思考交给LLM
实现个简单的智能体，截图如下：

习题：

习题1 智能体判断与分类

case A：一台符合冯·诺依曼结构的超级计算机

是否属于智能体？ 否。
理由：该计算机只是一台通用计算设备，不具备感知环境、自主决策和采取行动的能力。它被动执行预设程序，没有目标导向性，因此不符合智能体的定义。

case B：特斯拉自动驾驶系统

是否属于智能体？ 是。
分类维度 ：
- 内部决策架构：基于模型的反射智能体。系统利用内部世界模型（如车辆动力学、道路结构）结合实时传感器数据，快速做出反应。
- 时间与反应性：反应式智能体。决策需在毫秒级完成，强调即时响应。
- 知识表示：亚符号主义为主。感知部分依赖深度学习（视觉识别），控制部分可能结合规则，但整体以神经网络为核心。
理由：系统通过摄像头、雷达等传感器感知环境，自主决策刹车或变道，并通过执行器控制车辆，目标为安全行驶，符合智能体定义。

case C：AlphaGo

是否属于智能体？ 是。
分类维度 ：
- 内部决策架构：基于目标的智能体（或基于效用）。通过蒙特卡洛树搜索评估未来走法，最大化获胜概率。
- 时间与反应性：规划式智能体。对弈中需深入计算数十步，属于深思熟虑的规划。
- 知识表示：神经符号混合。神经网络评估局面（亚符号），搜索树进行符号推理（符号）。
理由：AlphaGo感知棋盘状态，自主规划最优落子，通过落子动作改变环境（棋盘），以获胜为目标，是典型的智能体。

case D：ChatGPT扮演的智能客服

是否属于智能体？ 是。
分类维度 ：
- 内部决策架构：LLM驱动的智能体。利用大语言模型的推理能力分解任务、调用工具（如查询订单）、生成回答。
- 时间与反应性：混合式智能体。既需对用户即时反馈（反应性），也需多步规划（如先查订单再分析原因）。
- 知识表示：神经符号混合。核心为神经网络，但通过提示生成结构化思维链，模拟符号推理。
理由：系统感知用户输入（文本），通过LLM推理，输出回复（行动），以解决问题为目标，具备自主性。

习题2 智能健身教练的PEAS描述与环境特性

PEAS模型描述

维度	内容
性能度量	心率监测准确率、运动计划达成率、用户满意度、动作纠正正确率、训练效果（如减脂/增肌进度）、安全性（避免过度训练）
环境	用户的身体状态（心率、运动强度、疲劳度）、运动场景（室内/户外）、可穿戴设备数据、用户语音/文本反馈、历史训练记录
执行器	语音播报（指导、鼓励、纠正）、屏幕显示（训练计划、视频示范）、可调整设备阻力（如智能跑步机）、发送饮食建议通知
传感器	可穿戴设备（心率带、智能手表）、摄像头（动作捕捉）、麦克风（语音指令）、触摸屏（用户输入）

环境特性分析

部分可观察：无法直接感知用户的肌肉疲劳、心理状态等，只能通过心率、动作等间接推断。
随机性：用户反应不确定（如突然停下、改变动作），传感器数据存在噪声。
动态性：用户状态实时变化（心率波动），环境可能变化（如户外天气影响）。
序贯性：当前训练动作影响后续疲劳度和计划调整。
多智能体：可能与其他健康应用、社交平台交互（如分享成绩），或存在多个用户同时使用。

习题3 电商退款处理方案比较

方案A（Workflow）与方案B（Agent）优缺点对比

方案	优点	缺点
Workflow	规则明确，易于实现和审计；处理速度快；成本低；适用于标准化场景	僵化，无法处理复杂或例外情况；用户个性化体验差；可能误判（如恶意退款与真实问题难以区分）
Agent	灵活，能处理复杂、多变情形；可结合用户历史行为进行个性化决策；提升用户体验	决策过程不透明，难以解释；可能产生错误（幻觉）；需要大量训练数据和算力；存在安全风险

适用场景

Workflow更合适：小额、标准化的退款（如7天内无理由退款），规则清晰且风险低，追求效率。
Agent更有优势：大额退款、特殊商品（定制、易损）、涉及复杂纠纷（如用户多次投诉），需要综合判断。

方案C：混合模式

思路：采用分级处理。先用Workflow自动处理常规情况（如金额<500元且符合政策），若触发异常条件（如金额过高、用户历史行为可疑）则转交Agent进行深度分析，Agent可提供建议并最终由人工审核。这样既保持效率，又增强灵活性，同时保留人工干预通道，降低风险。

习题4 智能旅行助手功能扩展思路

1. 添加"记忆"功能

思路：维护一个用户偏好数据库（如JSON文件或内存字典），存储用户的历史偏好（如喜欢历史文化、预算范围）。在每次交互开始时，将记忆内容作为系统提示的一部分注入，或在每次思考时让智能体查询记忆。
修改循环 ：在prompt_history中加入记忆摘要，例如"用户偏好：历史文化景点，预算500元以内"。每次行动后，可让智能体更新记忆（如通过update_memory工具）。

2. 自动推荐备选方案

思路：当工具调用返回"门票售罄"等信息时，智能体应识别为失败，并重新规划。可在Observation中检测特定关键词，然后强制让智能体再次思考，选择其他景点或调整查询条件。
修改循环 ：在解析Observation后，若包含"售罄"等词，可追加一条提示"推荐失败，请尝试其他景点"，然后继续循环。

3. 反思并调整推荐策略

思路：记录用户连续拒绝次数，当达到阈值（如3次）时，触发反思步骤。可在Prompt中加入"如果用户连续拒绝，请反思可能原因（如推荐类型不符、价格问题）并调整策略"。
修改循环 ：在prompt_history中记录拒绝次数，并在下一次循环前添加系统消息"用户已拒绝前3次推荐，请反思并尝试不同风格的景点"。智能体应输出反思内容（如Thought中包含分析），然后调整行动。

习题5 双系统理论在医疗诊断助手中的应用

应用场景：智能医疗诊断助手

系统1（快速直觉）：处理常见病症的初步筛查。例如，根据患者描述的发热、咳嗽、流涕等症状，快速匹配感冒、流感等常见病，给出初步建议（如多喝水、休息）。系统1基于深度学习模型，从海量病例中学习模式，响应速度快。
系统2（慢速推理）：处理复杂或罕见病例。当症状模糊、多种疾病可能重叠，或系统1置信度低时，系统2启动。它调用医学知识库，检索相关文献，分析检查报告，进行逻辑推理，生成鉴别诊断列表，并建议进一步检查。系统2可能结合符号推理（如规则引擎）和知识图谱。
协同工作 ：
1. 患者输入症状，系统1快速给出初步判断和置信度。
2. 若置信度高且无危险信号，直接输出建议。
3. 若置信度低或症状复杂，系统2介入，进行深度分析，可能要求患者补充信息，最终给出更精准的诊断和下一步方案。
4. 系统2也可验证系统1的结果，例如当系统1误判时，系统2通过推理纠正。
5. 整个过程中，系统1负责直觉感知，系统2负责理性验证，实现高效与准确的平衡。

习题6 智能体局限分析

1. 为什么智能体有时会产生"幻觉"？

原因：
- LLM基于统计生成，缺乏真实世界知识，可能编造事实以符合上下文。
- 训练数据包含错误或矛盾信息，模型学习了噪声。
- 模型追求流畅性而非准确性，尤其在信息不足时倾向于补全。
- 提示工程不当，未明确要求基于事实或引用来源。

2. 无循环限制可能陷入什么问题？

可能问题 ：
- 无限循环：反复调用同一工具而不推进任务（如不断查询天气但无后续）。
- 决策震荡：在几个行动间来回切换，无法收敛。
- 资源耗尽：无限调用API导致成本激增或系统崩溃。
- 逻辑死锁：因信息不足或矛盾而无法继续，但又不结束。

3. 如何评估智能体的"智能"程度？仅用准确率是否足够？

评估维度 ：
- 任务完成率：成功达成目标的比例。
- 效率：完成任务所需的步骤、时间、资源消耗。
- 鲁棒性：应对异常、噪声输入的能力。
- 可解释性：决策过程是否透明，能否给出理由。
- 用户满意度：交互体验、结果是否符合预期。
- 泛化能力：处理未见过任务的能力。
- 安全性：避免有害行为。
准确率不足：准确率仅反映最终输出与标准答案的匹配，但无法衡量智能体的规划、推理、工具使用等过程性能力，也无法反映其在动态环境中的适应能力。因此需结合多维度综合评估。

课程参考来源：hello-agents

上一篇：OpenCV 实战：花朵轮廓提取与近似轮廓绘制

下一篇：MySQL 8 中大小写敏感与不敏感排序规则的选择

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09CC-Switch & Claude 基于 Linux 服务器安装使用指南 102026 年 AI 大模型 & AI 编程工具实战全总结