【AI Agent 学习笔记 task1】Day2:初识智能体

【AI Agent 学习笔记 task1】Day2:初识智能体

上一篇:【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战


一、Agent 的本质

Agent(智能体)= 大模型(大脑)+ 工具(手脚)+ 控制循环(决策)

与普通 LLM 调用的区别:

特性 普通 LLM Agent
执行方式 单次问答 多轮循环
工具使用 可调用外部 API
决策能力 自主规划执行步骤
结果反馈 直接生成 基于观察调整策略

二、ReAct 模式:Thought-Action-Observation

本章核心:ReAct(Reasoning + Acting)是 Agent 的主流实现范式。

2.1 三要素结构

复制代码
Thought(思考)→ Action(行动)→ Observation(观察)→ ... → Finish(完成)

以我的运行日志为例:

循环 Thought Action Observation
1 用户要查天气+推荐景点,先获取天气 get_weather(city="北京") 小雨阵雨,10°C
2 (模型输出为空) ------ ❌ 解析失败:未找到 Action
3 已获取天气,根据雨天推荐景点 get_attraction(city="北京", weather="Light rain shower") 博物馆、海洋馆等室内景点
4 整合信息,生成回答 Finish[...] 任务完成

2.2 关键观察

错误循环的价值 :第 2 轮模型输出为空导致解析失败,但 Agent 自动重试进入第 3 轮。这说明:

  • Agent 具备容错能力
  • 控制循环会强制要求模型遵循格式规范
  • 失败后会重新调用 LLM,而非直接报错退出

三、工具(Tool)的作用

本章代码中 Agent 使用了两个工具:

python 复制代码
# 工具定义示例
get_weather(city: str) -> str  # 获取指定城市天气
get_attraction(city: str, weather: str) -> str  # 根据天气推荐景点

核心设计:LLM 只负责决定"调用什么工具、传什么参数",实际执行由框架完成。这种分离让 Agent 既能利用大模型的推理能力,又能获得精确的外部数据。


四、Prompt 工程:控制模型行为

Agent 能遵循 Thought-Action 格式,核心在于 System Prompt 的设计

复制代码
你必须按以下格式回复:
Thought: 你的思考过程
Action: 工具名(参数=值)

或者任务完成时:
Action: Finish[最终答案]

Prompt 技巧:

  1. 少样本示例(Few-shot):给 1-2 个正确格式的例子
  2. 严格格式约束:明确分隔符、字段名
  3. 错误处理提示:告知模型输出错误会怎样

五、关键代码逻辑

python 复制代码
max_loops = 5  # 防止无限循环
for i in range(max_loops):
    # 1. 组装 Prompt(历史记录 + 工具描述 + 用户输入)
    prompt = build_prompt(history, tools, user_input)
    
    # 2. 调用 LLM
    response = llm.chat(prompt)
    
    # 3. 解析 Thought 和 Action
    thought, action = parse_response(response)
    
    # 4. 执行工具
    if action == "Finish":
        return result  # 任务完成
    else:
        observation = execute_tool(action)
        history.append(f"Observation: {observation}")  # 反馈给下一轮

六、学习总结

Agent 核心认知

  1. 不是更复杂的 Prompt,而是"推理-行动"的闭环
  2. LLM 当"决策者",工具当"执行者"
  3. 观察结果反馈给 LLM,实现动态调整

与上一篇的衔接

  • Day1:环境配置 + 跑通代码
  • Day2:理解 ReAct 原理 + 分析运行日志

下一步:学习第二章------工具的定义与注册机制。


运行截图


参考资源


📖 项目教程地址

hello-agents - Datawhale AI Agent 入门教程

👉 https://github.com/datawhalechina/hello-agents


版权声明:本笔记基于 Datawhale hello-agents 开源项目整理,转载请注明出处。

记录时间:2026年3月17日

本文由AI润色输出总结

相关推荐
湘美书院--湘美谈教育14 小时前
湘美谈教育湘美书院考古教育系列:湖湘一万年序列整理研究
大数据·人工智能·深度学习·神经网络·机器学习
星辰AI打工人14 小时前
Gemma 4 E2B LoRA 微调全记录:从 ROCm 环境搭建到 Ollama 本地部署
人工智能
财经资讯数据_灵砚智能14 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月10日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
雪隐14 小时前
AI股票小助手09-结果展示
人工智能·后端
用户3379225456814 小时前
从字节跳动 DeerFlow 源码看 Agent 平台设计(三):五个核心中间件深度解析
人工智能
沪漂阿龙14 小时前
RAG 是什么?为什么大模型需要外挂知识库?
人工智能·架构·langchain
蝎子莱莱爱打怪14 小时前
AI时代,戒骄戒躁,静下心来,想清楚,再出发!
人工智能·程序员
数字游民952714 小时前
PDF批量转Markdown工具:我用AI做了一个本地桌面版,也顺手想了想AI工具怎么落地
人工智能·ai·pdf·aigc·自媒体·数字游民9527
KaMeidebaby14 小时前
卡梅德生物技术快报|biotin 生物素标记抗体全流程
前端·人工智能·算法·数据挖掘·数据分析
聂二AI落地内参14 小时前
从 AI 幻觉到重试:体检报告 AI 的几个工程坑
人工智能