Less autonomous(低自主性)
所有步骤都是预先设定好的,所有工具调用都是硬编码的(Hard-coded),由人类工程师在代码中固定;其中主要自主性体现在语言模型生成的文本上。
案例:
你告诉 LLM:"写一篇关于黑洞的论文"
LLM → 写出搜索关键词
去网页搜
抓取网页内容
LLM 把这些内容整合成文章
这就像你指挥一个"听话但不会动脑"的助手:你得一步步告诉它做什么、什么时候查资料、怎么整理。AI 只负责"写",其他事都得你来操心。
More autonomous(高自主性)
代理能自主做出大量决策;能够动态地决定要执行的步骤顺序;甚至可以创建新的、可执行的工具(函数)来完成任务。
你告诉 LLM:"写一篇关于黑洞的论文"
LLM 自己决定:先"web search"查资料 → 并且能调用"news"和"arXiv"等工具,找最新科研动态
找到结果后,它自己判断:"我要选5个最好的来源" → 调用"web fetch" + "pdf to text"工具提取内容
然后它写初稿 → 再自己反思:"这个段落逻辑不够强,数据没引用清楚" → 主动改进草稿
最后输出高质量论文!

工具使用 (Tool Use)
核心概念: 赋予语言模型调用外部工具或函数的能力,以扩展其功能边界。
工作流程:
识别需求: 模型在处理任务时,判断需要调用哪个工具。
调用工具: 模型生成调用该工具的指令或参数。
执行与返回: 工具执行操作(如搜索网络、计算数学公式),并将结果返回给模型。
整合结果: 模型利用工具返回的结果来完成最终任务。
工具类型举例:
信息收集: Web search, Wikipedia, Database access.
分析计算: Code Execution, Wolfram Alpha, Bearly Code Interpreter.
生产力: Email, Calendar, Messaging.
图像处理: Image generation, Image captioning, OCR.