【Agent智能体2 | Agent的自主性程度】

声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。

Agent的自主性程度

网上有很多关于"哪些词能真正代表智能体"这样的争论,吴恩达在课程中说到与其争论哪些词都够真正的代表智能体 ,不如承认智能体可以有不同程度的智能体性 。这也是Agentic这个词的由来,Agentic(智能体性)是形容词,而不是一个名词。

这个图展示了较低自主性 (Less autonomous)以及 较高自主性 (More autonomous)的对比

  • 较低自主性 (Less autonomous)
    • 上半部分展示的是一个线性且固定 的链式工作流:用户输入提示词 →\rightarrow→ LLM 生成网页搜索词 →\rightarrow→ 系统执行网页搜索 →\rightarrow→ 系统抓取网页内容 →\rightarrow→ LLM 根据抓取的内容撰写文章。
    • 这个流程中,LLM 就像流水线上的工人。程序的每一步都是被开发者事先硬编码规定好的,LLM 只能在特定的节点被动接收指令并执行固定任务。
  • 较高自主性 (More autonomous)
    • 下半部分展示的是一个更接近智能体(Agent)模式的工作流,赋予了 LLM 决策权和反思能力。
      • 自主选择工具(Tools):
        • 在第一步"搜索网页"时,LLM有一个工具箱 (包含了网页搜索、新闻搜索、arXiv学术论文搜索),LLM 可以自主决定调用哪个工具来获取最好的信息
        • 在第二步"抓取最佳来源"时,LLM 再次利用工具箱 (网页抓取、PDF转文本),自主评估并挑选出5个最相关的来源进行深度解析,而不是盲目抓取所有结果。
      • 自我反思与迭代(Reflection):
        • LLM 在写完初稿(Write essay draft)后,没有直接输出结果,而是增加了一个"反思并改进初稿(Reflect and improve draft)"的环节。LLM 会自我审视文章的质量,并进行修改润色,最终输出成品。
          总结:
  • 我们可以看到有些智能体的自主性较低,执行一些列的线性步骤,通常是由程序员预先设定好的
  • 有些更有自主性,可以信任大语言模型做更多决策,具体执行的步骤序列甚至由大语言摸型快定,而不是由程序员预先设定

总结

这个图从左到右代表了 AI 系统的自主能力从低到高的三个发展阶段:

  • 较低自主性 (Less autonomous)
    这个阶段的 AI 系统更像是传统的软件程序,缺乏真正的决策权。
    • 所有步骤预先设定 (All steps predetermined): 整个工作流程(Pipeline)是线性的、固定的,由开发者提前规划好。
    • 工具使用硬编码 (All tool use hard coded): 在哪个环节调用什么工具(比如搜索、翻译)是被人类写死在代码里的,AI 无法改变。
    • 自主性仅限文本生成 (Autonomy is in text generation): AI 在这里的唯一作用就是在流程的固定节点上,根据给定的上下文生成一段文本,它不负责流程的控制。
  • 半自主 (Semi-autonomous)
    这个阶段的 AI 开始拥有"大脑"的属性,具备一定的逻辑规划和调度能力。
    • 能做部分决策、选择工具 (Agent can make some decisions, choose tools): 面对一个任务,AI 可以自己思考并决定接下来该怎么做,比如判断当前需要搜索网页还是查询数据库。
    • 工具是预设的 (All tools predefined): 它的局限性在于,它只能在人类事先提供好的"工具箱"里进行选择,不能超出这个范围。
  • 高度自主 (Highly autonomous)
    这是目前 AI 智能体追求的高级形态,具备极强的独立解决未知问题的能力。
    • 自主做出大量决策 (Agent makes many decisions autonomously): 面对复杂、长期的目标,AI 能够自行拆解任务、制定多步计划、执行、反思纠错,并在遇到障碍时动态调整策略。
    • 能即时创建新工具 (Can create new tools on the fly): 这是最核心的区别。如果人类给的工具箱里没有合适的工具,高度自主的 AI 能够根据需求现场编写一段代码来创造一个新工具,并立刻使用它来解决当前的问题。

通过这篇文章,我们能够了解到自主性高的智能体是什么样的:调用工具、拆解任务、制定计划、反思纠错,甚至能创造新工具!了解了这些,我们以后在使用 AI 时,也不应仅仅把它当成一个单步的'问答盲盒',而应该尝试给它更多的空间,激发它更高的自主性

如果这篇文章对你有帮助,欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力!

相关推荐
hujinyuan201603 小时前
2025年12月中国电子学会青少年机器人技术等级考试试卷(二级) 真题+答案
人工智能·算法·机器人
码农小白AI3 小时前
采购合同与来料证书对标校验,IACheck联动AI报告审核通审Agent版自动识别指标不符单据
人工智能
元岳数字人小元4 小时前
AI 数字人开发公司浅谈 虚拟数字人打造景区新服务
人工智能·人机交互·交互
哦哦~9214 小时前
AI赋能生物医学:从临床数据到药物分子性质预测实战培
人工智能·生物医学·药物分子
GIS数据转换器4 小时前
城市排水生命线安全运行监测平台深度解析
java·运维·人工智能·python·安全·数据挖掘·无人机
虫无涯4 小时前
本地离线大模型实战:Ollama + Llama 3.1 8B 全流程部署(适配VSCode Continue代码助手)
人工智能
Rocky Ding*4 小时前
Latent Consistency Models:一篇读懂扩散模型的少步生成核心基础知识
人工智能·深度学习·机器学习·ai作画·stable diffusion·aigc·ai-native
大山佬4 小时前
AI 边缘部署:MCU 上的轻量级目标检测,从 YOLO 到 TFLite Micro 的全链路优化
人工智能
数睿数据无代码开发4 小时前
深度解析smardaten数据大屏:六大核心功能重塑可视化开发
人工智能·信息可视化
陈猪的杰咪4 小时前
GitHub Copilot 2026计费新规:AI Credits消耗解析与节省策略
人工智能·ai·架构·github·copilot