Agentic TASK01 - 技术栈

所有步骤都是预先设定好的，所有工具调用都是硬编码的（Hard-coded），由人类工程师在代码中固定；其中主要自主性体现在语言模型生成的文本上。

案例：

你告诉 LLM："写一篇关于黑洞的论文"

LLM → 写出搜索关键词

去网页搜

抓取网页内容

LLM 把这些内容整合成文章

这就像你指挥一个"听话但不会动脑"的助手：你得一步步告诉它做什么、什么时候查资料、怎么整理。AI 只负责"写"，其他事都得你来操心。

代理能自主做出大量决策；能够动态地决定要执行的步骤顺序；甚至可以创建新的、可执行的工具（函数）来完成任务。

你告诉 LLM："写一篇关于黑洞的论文"

LLM 自己决定：先"web search"查资料 → 并且能调用"news"和"arXiv"等工具，找最新科研动态

找到结果后，它自己判断："我要选5个最好的来源" → 调用"web fetch" + "pdf to text"工具提取内容

然后它写初稿 → 再自己反思："这个段落逻辑不够强，数据没引用清楚" → 主动改进草稿

最后输出高质量论文！

核心概念：赋予语言模型调用外部工具或函数的能力，以扩展其功能边界。

工作流程：

识别需求：模型在处理任务时，判断需要调用哪个工具。

调用工具：模型生成调用该工具的指令或参数。

执行与返回：工具执行操作（如搜索网络、计算数学公式），并将结果返回给模型。

整合结果：模型利用工具返回的结果来完成最终任务。

工具类型举例：

信息收集： Web search, Wikipedia, Database access.

分析计算： Code Execution, Wolfram Alpha, Bearly Code Interpreter.

生产力： Email, Calendar, Messaging.

图像处理： Image generation, Image captioning, OCR.