🤖 AI智能体开发「核心概念」速查手册
本人全是抽象概念,留作备忘,不喜者深入。
从「调API」到「造智能体」,你需要掌握的20个核心概念
📊 一、智能体架构核心概念
| 概念 | 英文 | 通俗解释 | 示例代码/场景 | 类比 |
|---|---|---|---|---|
| 智能体 | Agent | 能自主决策、调用工具的AI程序 | 运维助手:查资产→分析漏洞→执行重启 | 一个数字员工 |
| 工作流 | Workflow | 预定义好的执行步骤序列 | 先查CMDB→再查漏洞库→最后生成报告 | 岗位SOP手册 |
| 编排 | Orchestration | 协调多个Agent协同工作 | 资产Agent + 漏洞Agent + 变更Agent 一起干活 | 项目经理 |
| 工具 | Tool | Agent能调用的外部功能 | search_assets(), restart_server(), send_email() |
员工的工具箱 |
| 知识库 | Knowledge Base | 给Agent参考的文档/数据 | 资产清单、漏洞库、等保条款的向量化存储 | 员工的培训手册 |
🔄 二、迭代开发相关概念
| 概念 | 英文 | 通俗解释 | 示意图/代码 | 关键点 |
|---|---|---|---|---|
| 观测层 | Observation Layer | 采集Agent的执行日志、用户反馈、异常 | ``` | |
| 👤 用户: "查不到IP" | ||||
| 🤖 Agent: 返回错误 | ||||
| 📝 采集: {error: "IP not found", feedback: "点踩"} |
|
| **自优化层** | Self-Optimization Layer | 根据观测数据自动改进 | ```
旧Prompt: "返回资产信息"
新Prompt: "返回资产信息,必须包含IP"
```| 闭环核心 |
| **治理层** | Governance Layer | 人工审核、风险控制 | ```
高风险操作 → 暂停 → 通知管理员 → 审核通过 → 执行
```| 安全护栏 |
| **数据飞轮** | Data Flywheel | 越用越好的正向循环 | 更多用户 → 更多反馈 → 更好模型 → 更多用户 | 增长引擎 |
| **持续迭代** | Continuous Iteration | 不停采集→优化→上线的循环 | 每天一个小版本,每周一个大版本 | DevOps for AI |
---
## 🧠 三、人类参与相关概念
| 概念 | 英文 | 通俗解释 | 流程图 | 应用场景 |
|------|------|----------|--------|----------|
| **人在回路** | Human-in-the-Loop | 关键环节需要人参与决策 | ```
AI生成方案 → 人审核 → 通过才执行
```| 高危操作、权限变更 |
| **人类反馈** | Human Feedback | 人对AI输出进行评价 | ```
[👍 有帮助] [👎 没帮助] [✏️ 修正]
```| 强化学习数据源 |
| **强化学习** | RLHF | 用人类反馈优化模型 | 收集点踩数据 → 训练奖励模型 → 微调LLM | ChatGPT核心技术 |
| **人机协同** | Human-AI Collaboration | 人和AI互相配合 | 人定目标,AI执行;AI出方案,人决策 | 最佳实践 |
| **主动学习** | Active Learning | AI主动问人"这个对吗" | ```
AI: "这个漏洞修复方案有70%置信度,需要您确认"
```| 冷启动阶段 |
---
## 🛠️ 四、智能体能力相关概念
| 概念 | 英文 | 通俗解释 | 代码示例 | 类比 |
|------|------|----------|----------|------|
| **技能** | Skill | Agent能完成的原子能力 | ```python
@tool
def get_server_ip(name: str):
return db.query(f"SELECT ip FROM assets WHERE name={name}")
```| 员工的单项技能 |
| **任务** | Task | 需要多步完成的复杂工作 | ```
Task: 处理服务器宕机
Steps: 1. 定位IP 2. 检查状态 3. 尝试重启 4. 通知owner
```| 员工的任务清单 |
| **规划** | Planning | Agent自己拆解任务 | ```
用户: "北京分院服务器有问题"
规划: 1. 查北京分院有哪些服务器
2. 检查每台状态
3. 找出异常的
```| 员工的工作计划 |
| **记忆** | Memory | 短期/长期记住信息 | ```
短期: 本轮对话内容
长期: 用户常查"北京分院",下次优先返回
```| 员工的经验 |
| **推理** | Reasoning | 根据信息得出结论 | ```
已知: db-03 CPU 92%, 运行Java应用
推理: 可能是GC问题,建议重启或调优
```| 员工的判断力 |
---
## 📝 五、函数调用相关概念
| 概念 | 英文 | 通俗解释 | 代码示例 | 说明 |
|------|------|----------|----------|------|
| **函数调用** | Function Calling | LLM决定调用哪个函数 | ```json
{
"name": "restart_server",
"arguments": {"ip": "10.88.3.21"}
}
```| OpenAI/ChatGLM都支持 |
| **工具调用** | Tool Calling | 同上,更通用的说法 | ```python
tools = [
Tool(name="查资产", func=search_asset),
Tool(name="查漏洞", func=search_vuln)
]
```| LangChain术语 |
| **结构化输出** | Structured Output | 强制LLM按格式返回 | ```python
class AssetInfo(BaseModel):
name: str
ip: str
status: str
```| 用Pydantic定义 |
| **思维链** | Chain of Thought | 让LLM先思考再回答 | ```
问题: db-03 CPU高怎么办?
思考: 1. 先查是不是Java应用
2. 查GC日志
3. 如果是,建议重启
```| 提高准确性 |
| **ReAct模式** | Reason + Act | 思考→行动→观察循环 | ```
Thought: 需要查db-03的IP
Action: search_asset("db-03")
Observation: 10.88.3.21
Thought: IP找到了,现在可以重启
```| Agent核心模式 |
---
## 🧩 六、RAG相关概念
| 概念 | 英文 | 通俗解释 | 示意图 | 关键点 |
|------|------|----------|--------|--------|
| **检索增强生成** | RAG | 先查资料再回答问题 | ```
用户问题 → 向量检索 → 找到相关文档 → LLM生成回答
```| 解决幻觉问题 |
| **向量化** | Embedding | 把文字转成数学向量 | `"服务器" → [0.1, 0.3, -0.2, ...]` | 让计算机理解语义 |
| **向量数据库** | Vector DB | 存向量的数据库 | Chroma, PGVector, Qdrant | 快速相似性搜索 |
| **分块** | Chunking | 把长文档切成小段 | 500字一段,重叠50字 | 提高检索精度 |
| **重排序** | Reranking | 对检索结果重新排序 | 向量召回的top20,用精排模型重排取top5 | 提高准确率 |
---
## 📈 七、评估相关概念
| 概念 | 英文 | 通俗解释 | 计算公式/方法 | 目标 |
|------|------|----------|--------------|------|
| **准确率** | Accuracy | 答对的比率 | 正确数 / 总数 | 基础指标 |
| **召回率** | Recall | 该找到的都找到了吗 | 找到的相关文档 / 总相关文档 | RAG核心指标 |
| **幻觉率** | Hallucination Rate | 胡编乱造的比例 | 幻觉次数 / 总回答次数 | 安全指标 |
| **延迟** | Latency | 响应速度 | 从提问到回答的时间 | 体验指标 |
| **成本** | Cost | token消耗 | 输入token数 + 输出token数 | 经济指标 |
| **A/B测试** | A/B Testing | 对比新旧版本效果 | 50%流量旧版,50%新版,看哪个好 | 科学决策 |
---
## 🎯 八、一句话总结所有概念
智能体(Agent)通过 规划(Planning) 和 推理(Reasoning),
调用各种 工具(Tools)/技能(Skills) 完成 任务(Tasks),
过程中依赖 记忆(Memory) 和 知识库(RAG),
通过 函数调用(Function Calling) 与外部系统交互,
遵循 ReAct模式(思考→行动→观察) 循环,
最终输出 结构化结果(Structured Output)。
整个系统通过 人在回路(HITL) 收集 人类反馈(Human Feedback),
经过 观测层(Observation) → 自优化层(Optimization) → 治理层(Governance) 的
持续迭代(Continuous Iteration) 形成 数据飞轮(Data Flywheel),
用 准确率、召回率、幻觉率、延迟、成本 等指标 持续评估 效果。
---
## 📊 九、概念关系图
┌─────────────────────────────────────────────────────────────────┐
│ 🎯 业务目标 │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 🤖 智能体(Agent) │ │
│ │ ┌──────────┬──────────┬──────────┬──────────┬────────┐ │ │
│ │ │ 规划 │ 推理 │ 记忆 │ 工具 │ 知识库 │ │ │
│ │ │Planning │Reasoning │ Memory │ Tool │ RAG │ │ │
│ │ └──────────┴──────────┴──────────┴──────────┴────────┘ │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 🔄 执行循环 │ │
│ │ Thought → Action → Observation → Thought ... │ │
│ │ (ReAct模式) │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 📊 观测反馈层 │ │
│ │ 用户反馈 · 执行日志 · 异常捕获 · 性能指标 │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ ⚙️ 自优化层 │ │
│ │ Prompt优化 · RAG更新 · 流程修正 · 模型微调 │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 🛡️ 治理层 │ │
│ │ 风险分级 · 人工审核 · 强制暂停 · 一键回滚 │ │
│ └──────────────────────────────────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ 📈 持续迭代 │ │
│ │ 每天一个小版本 · 每周一个大版本 · 永远在进化 │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
---
## 🔍 十、实际场景中的概念应用
### 场景:运维助手处理"服务器宕机"
1️⃣ 用户输入: "web-01好像挂了,帮我看看"
2️⃣ 智能体(Agent) 开始 规划(Planning):
- 先查web-01的IP和状态
- 如果真挂了,尝试重启
- 通知负责人
3️⃣ 调用 工具(Tool):
python
asset_info = search_asset("web-01") # 返回 {ip: "10.88.1.12", status: "down"}
4️⃣ 推理(Reasoning):
- 状态是down,需要重启
- 重启是高风险操作,需要 人在回路(HITL)
5️⃣ 治理层(Governance) 拦截:
python
risk_score = calculate_risk("restart", asset="web-01") # 返回 85 (高风险)
if risk_score > 80:
pause_and_notify_admin()
6️⃣ 管理员收到通知,在 治理层 审核:
- 查看影响范围
- 确认可以重启
- 点击"通过"
7️⃣ 执行重启,记录到 观测层(Observation):
json
{
"action": "restart",
"asset": "web-01",
"result": "success",
"human_approved": true,
"time_taken": "2.3s"
}
8️⃣ 数据进入 自优化层(Optimization):
- 类似场景下次可以半自动
- 重启成功率100%,可以考虑降低风险分
9️⃣ 形成 数据飞轮(Data Flywheel):
-
更多成功案例 → 模型更自信 → 处理更快 → 更多用户使用
📝 十一、需要掌握的代码示例
1. 定义Tool
pythonfrom langchain.tools import tool @tool def get_server_ip(server_name: str) -> str: """根据服务器名称查询IP地址""" # 实际从CMDB查询 result = db.query(f"SELECT ip FROM assets WHERE name='{server_name}'") return result[0] if result else "未找到"
2. 定义结构化输出
python
from pydantic import BaseModel
from typing import List
class AssetInfo(BaseModel):
name: str
ip: str
status: str
owner: str
vulnerabilities: List[str] = []
3. ReAct Agent 核心逻辑
python
def react_agent(query):
thoughts = []
while not done:
# Thought
thought = llm.invoke(f"当前问题:{query},历史:{thoughts},下一步该做什么?")
thoughts.append(thought)
# Action
if "需要查资产" in thought:
result = search_asset(query)
elif "需要重启" in thought:
result = call_human_for_approval("重启") # 人在回路
# Observation
observation = f"执行结果:{result}"
thoughts.append(observation)
# 判断是否完成
done = llm.invoke(f"根据{observation},问题解决了吗?")
4. 观测层数据采集
python
class Observation:
def collect_feedback(self, message_id, feedback_type, feedback_text=None):
return {
"message_id": message_id,
"type": feedback_type, # "like", "dislike", "correction"
"text": feedback_text,
"timestamp": datetime.now(),
"user_id": current_user.id
}
def detect_anomaly(self, agent_log):
# 检测异常模式
if agent_log.error_rate > 0.2:
alert("错误率过高", agent_log)
🎯 总结:需要重点掌握的20个概念
| 类别 | 概念 | 掌握程度 |
|---|---|---|
| 核心 | Agent, Tool, Workflow, Orchestration | ⭐⭐⭐⭐⭐ |
| 迭代 | Observation, Optimization, Governance, Data Flywheel | ⭐⭐⭐⭐⭐ |
| 人类 | Human-in-the-Loop, RLHF, Active Learning | ⭐⭐⭐⭐ |
| 能力 | Planning, Reasoning, Memory, Function Calling | ⭐⭐⭐⭐⭐ |
| RAG | Embedding, Vector DB, Chunking, Reranking | ⭐⭐⭐⭐ |
| 评估 | Accuracy, Recall, Latency, Cost | ⭐⭐⭐ |
记住:AI时代,懂概念的人指挥AI,不懂概念的人被AI指挥。