AI智能体AI开发「核心概念」速查手册

🤖 AI智能体开发「核心概念」速查手册

本人全是抽象概念，留作备忘，不喜者深入。

从「调API」到「造智能体」，你需要掌握的20个核心概念

📊 一、智能体架构核心概念

概念	英文	通俗解释	示例代码/场景	类比
智能体	Agent	能自主决策、调用工具的AI程序	运维助手：查资产→分析漏洞→执行重启	一个数字员工
工作流	Workflow	预定义好的执行步骤序列	先查CMDB→再查漏洞库→最后生成报告	岗位SOP手册
编排	Orchestration	协调多个Agent协同工作	资产Agent + 漏洞Agent + 变更Agent 一起干活	项目经理
工具	Tool	Agent能调用的外部功能	`search_assets()`, `restart_server()`, `send_email()`	员工的工具箱
知识库	Knowledge Base	给Agent参考的文档/数据	资产清单、漏洞库、等保条款的向量化存储	员工的培训手册

🔄 二、迭代开发相关概念

概念	英文	通俗解释	示意图/代码
观测层	Observation Layer	采集Agent的执行日志、用户反馈、异常	```
👤 用户: "查不到IP"
🤖 Agent: 返回错误
📝 采集: {error: "IP not found", feedback: "点踩"}

| 复制代码

| **自优化层** | Self-Optimization Layer | 根据观测数据自动改进 | ```
旧Prompt: "返回资产信息"
新Prompt: "返回资产信息，必须包含IP"
```| 闭环核心 |
| **治理层** | Governance Layer | 人工审核、风险控制 | ```
高风险操作 → 暂停 → 通知管理员 → 审核通过 → 执行
```| 安全护栏 |
| **数据飞轮** | Data Flywheel | 越用越好的正向循环 | 更多用户 → 更多反馈 → 更好模型 → 更多用户 | 增长引擎 |
| **持续迭代** | Continuous Iteration | 不停采集→优化→上线的循环 | 每天一个小版本，每周一个大版本 | DevOps for AI |

---

## 🧠 三、人类参与相关概念

| 概念 | 英文 | 通俗解释 | 流程图 | 应用场景 |
|------|------|----------|--------|----------|
| **人在回路** | Human-in-the-Loop | 关键环节需要人参与决策 | ```
AI生成方案 → 人审核 → 通过才执行
```| 高危操作、权限变更 |
| **人类反馈** | Human Feedback | 人对AI输出进行评价 | ```
[👍 有帮助] [👎 没帮助] [✏️ 修正]
```| 强化学习数据源 |
| **强化学习** | RLHF | 用人类反馈优化模型 | 收集点踩数据 → 训练奖励模型 → 微调LLM | ChatGPT核心技术 |
| **人机协同** | Human-AI Collaboration | 人和AI互相配合 | 人定目标，AI执行；AI出方案，人决策 | 最佳实践 |
| **主动学习** | Active Learning | AI主动问人"这个对吗" | ```
AI: "这个漏洞修复方案有70%置信度，需要您确认"
```| 冷启动阶段 |

---

## 🛠️ 四、智能体能力相关概念

| 概念 | 英文 | 通俗解释 | 代码示例 | 类比 |
|------|------|----------|----------|------|
| **技能** | Skill | Agent能完成的原子能力 | ```python
@tool
def get_server_ip(name: str):
    return db.query(f"SELECT ip FROM assets WHERE name={name}")
```| 员工的单项技能 |
| **任务** | Task | 需要多步完成的复杂工作 | ```
Task: 处理服务器宕机
Steps: 1. 定位IP 2. 检查状态 3. 尝试重启 4. 通知owner
```| 员工的任务清单 |
| **规划** | Planning | Agent自己拆解任务 | ```
用户: "北京分院服务器有问题"
规划: 1. 查北京分院有哪些服务器
      2. 检查每台状态
      3. 找出异常的
```| 员工的工作计划 |
| **记忆** | Memory | 短期/长期记住信息 | ```
短期: 本轮对话内容
长期: 用户常查"北京分院"，下次优先返回
```| 员工的经验 |
| **推理** | Reasoning | 根据信息得出结论 | ```
已知: db-03 CPU 92%, 运行Java应用
推理: 可能是GC问题，建议重启或调优
```| 员工的判断力 |

---

## 📝 五、函数调用相关概念

| 概念 | 英文 | 通俗解释 | 代码示例 | 说明 |
|------|------|----------|----------|------|
| **函数调用** | Function Calling | LLM决定调用哪个函数 | ```json
{
  "name": "restart_server",
  "arguments": {"ip": "10.88.3.21"}
}
```| OpenAI/ChatGLM都支持 |
| **工具调用** | Tool Calling | 同上，更通用的说法 | ```python
tools = [
    Tool(name="查资产", func=search_asset),
    Tool(name="查漏洞", func=search_vuln)
]
```| LangChain术语 |
| **结构化输出** | Structured Output | 强制LLM按格式返回 | ```python
class AssetInfo(BaseModel):
    name: str
    ip: str
    status: str
```| 用Pydantic定义 |
| **思维链** | Chain of Thought | 让LLM先思考再回答 | ```
问题: db-03 CPU高怎么办？
思考: 1. 先查是不是Java应用
      2. 查GC日志
      3. 如果是，建议重启
```| 提高准确性 |
| **ReAct模式** | Reason + Act | 思考→行动→观察循环 | ```
Thought: 需要查db-03的IP
Action: search_asset("db-03")
Observation: 10.88.3.21
Thought: IP找到了，现在可以重启
```| Agent核心模式 |

---

## 🧩 六、RAG相关概念

| 概念 | 英文 | 通俗解释 | 示意图 | 关键点 |
|------|------|----------|--------|--------|
| **检索增强生成** | RAG | 先查资料再回答问题 | ```
用户问题 → 向量检索 → 找到相关文档 → LLM生成回答
```| 解决幻觉问题 |
| **向量化** | Embedding | 把文字转成数学向量 | `"服务器" → [0.1, 0.3, -0.2, ...]` | 让计算机理解语义 |
| **向量数据库** | Vector DB | 存向量的数据库 | Chroma, PGVector, Qdrant | 快速相似性搜索 |
| **分块** | Chunking | 把长文档切成小段 | 500字一段，重叠50字 | 提高检索精度 |
| **重排序** | Reranking | 对检索结果重新排序 | 向量召回的top20，用精排模型重排取top5 | 提高准确率 |

---

## 📈 七、评估相关概念

| 概念 | 英文 | 通俗解释 | 计算公式/方法 | 目标 |
|------|------|----------|--------------|------|
| **准确率** | Accuracy | 答对的比率 | 正确数 / 总数 | 基础指标 |
| **召回率** | Recall | 该找到的都找到了吗 | 找到的相关文档 / 总相关文档 | RAG核心指标 |
| **幻觉率** | Hallucination Rate | 胡编乱造的比例 | 幻觉次数 / 总回答次数 | 安全指标 |
| **延迟** | Latency | 响应速度 | 从提问到回答的时间 | 体验指标 |
| **成本** | Cost | token消耗 | 输入token数 + 输出token数 | 经济指标 |
| **A/B测试** | A/B Testing | 对比新旧版本效果 | 50%流量旧版，50%新版，看哪个好 | 科学决策 |

---

## 🎯 八、一句话总结所有概念

智能体(Agent)通过规划(Planning) 和推理(Reasoning)，

调用各种工具(Tools)/技能(Skills) 完成任务(Tasks)，

过程中依赖记忆(Memory) 和知识库(RAG)，

通过函数调用(Function Calling) 与外部系统交互，

遵循 ReAct模式(思考→行动→观察) 循环，

最终输出结构化结果(Structured Output)。

整个系统通过人在回路(HITL) 收集人类反馈(Human Feedback)，

经过观测层(Observation) → 自优化层(Optimization) → 治理层(Governance) 的

持续迭代(Continuous Iteration) 形成数据飞轮(Data Flywheel)，

用准确率、召回率、幻觉率、延迟、成本等指标持续评估效果。

复制代码

---

## 📊 九、概念关系图

┌─────────────────────────────────────────────────────────────────┐

│ 🎯 业务目标 │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🤖 智能体(Agent) │ │

│ │ ┌──────────┬──────────┬──────────┬──────────┬────────┐ │ │

│ │ │ 规划 │ 推理 │ 记忆 │ 工具 │ 知识库 │ │ │

│ │ │Planning │Reasoning │ Memory │ Tool │ RAG │ │ │

│ │ └──────────┴──────────┴──────────┴──────────┴────────┘ │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🔄 执行循环 │ │

│ │ Thought → Action → Observation → Thought ... │ │

│ │ (ReAct模式) │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 📊 观测反馈层 │ │

│ │ 用户反馈 · 执行日志 · 异常捕获 · 性能指标 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ ⚙️ 自优化层 │ │

│ │ Prompt优化 · RAG更新 · 流程修正 · 模型微调 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🛡️ 治理层 │ │

│ │ 风险分级 · 人工审核 · 强制暂停 · 一键回滚 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 📈 持续迭代 │ │

│ │ 每天一个小版本 · 每周一个大版本 · 永远在进化 │ │

│ └──────────────────────────────────────────────────────────┘ │

└─────────────────────────────────────────────────────────────────┘

复制代码

---

## 🔍 十、实际场景中的概念应用

### 场景：运维助手处理"服务器宕机"

1️⃣ 用户输入: "web-01好像挂了，帮我看看"

2️⃣ 智能体(Agent) 开始规划(Planning):

先查web-01的IP和状态
如果真挂了，尝试重启
通知负责人

3️⃣ 调用工具(Tool):

python 复制代码

asset_info = search_asset("web-01")  # 返回 {ip: "10.88.1.12", status: "down"}

4️⃣ 推理(Reasoning):

状态是down，需要重启
重启是高风险操作，需要人在回路(HITL)

5️⃣ 治理层(Governance) 拦截:

python 复制代码

risk_score = calculate_risk("restart", asset="web-01")  # 返回 85 (高风险)
if risk_score > 80:
    pause_and_notify_admin()

6️⃣ 管理员收到通知，在治理层审核:

查看影响范围
确认可以重启
点击"通过"

7️⃣ 执行重启，记录到观测层(Observation):

json 复制代码

{
  "action": "restart",
  "asset": "web-01",
  "result": "success",
  "human_approved": true,
  "time_taken": "2.3s"
}

8️⃣ 数据进入自优化层(Optimization):

类似场景下次可以半自动
重启成功率100%，可以考虑降低风险分

9️⃣ 形成数据飞轮(Data Flywheel):

更多成功案例 → 模型更自信 → 处理更快 → 更多用户使用

📝 十一、需要掌握的代码示例

1. 定义Tool

python 复制代码

from langchain.tools import tool

@tool
def get_server_ip(server_name: str) -> str:
    """根据服务器名称查询IP地址"""
    # 实际从CMDB查询
    result = db.query(f"SELECT ip FROM assets WHERE name='{server_name}'")
    return result[0] if result else "未找到"

2. 定义结构化输出

python 复制代码

from pydantic import BaseModel
from typing import List

class AssetInfo(BaseModel):
    name: str
    ip: str
    status: str
    owner: str
    vulnerabilities: List[str] = []

3. ReAct Agent 核心逻辑

python 复制代码

def react_agent(query):
    thoughts = []
    while not done:
        # Thought
        thought = llm.invoke(f"当前问题：{query}，历史：{thoughts}，下一步该做什么？")
        thoughts.append(thought)
        
        # Action
        if "需要查资产" in thought:
            result = search_asset(query)
        elif "需要重启" in thought:
            result = call_human_for_approval("重启")  # 人在回路
        
        # Observation
        observation = f"执行结果：{result}"
        thoughts.append(observation)
        
        # 判断是否完成
        done = llm.invoke(f"根据{observation}，问题解决了吗？")

4. 观测层数据采集

python 复制代码

class Observation:
    def collect_feedback(self, message_id, feedback_type, feedback_text=None):
        return {
            "message_id": message_id,
            "type": feedback_type,  # "like", "dislike", "correction"
            "text": feedback_text,
            "timestamp": datetime.now(),
            "user_id": current_user.id
        }
    
    def detect_anomaly(self, agent_log):
        # 检测异常模式
        if agent_log.error_rate > 0.2:
            alert("错误率过高", agent_log)

🎯 总结：需要重点掌握的20个概念

类别	概念	掌握程度
核心	Agent, Tool, Workflow, Orchestration	⭐⭐⭐⭐⭐
迭代	Observation, Optimization, Governance, Data Flywheel	⭐⭐⭐⭐⭐
人类	Human-in-the-Loop, RLHF, Active Learning	⭐⭐⭐⭐
能力	Planning, Reasoning, Memory, Function Calling	⭐⭐⭐⭐⭐
RAG	Embedding, Vector DB, Chunking, Reranking	⭐⭐⭐⭐
评估	Accuracy, Recall, Latency, Cost	⭐⭐⭐

记住：AI时代，懂概念的人指挥AI，不懂概念的人被AI指挥。