AI智能体AI开发「核心概念」速查手册

🤖 AI智能体开发「核心概念」速查手册

本人全是抽象概念,留作备忘,不喜者深入。

从「调API」到「造智能体」,你需要掌握的20个核心概念


📊 一、智能体架构核心概念

概念 英文 通俗解释 示例代码/场景 类比
智能体 Agent 能自主决策、调用工具的AI程序 运维助手:查资产→分析漏洞→执行重启 一个数字员工
工作流 Workflow 预定义好的执行步骤序列 先查CMDB→再查漏洞库→最后生成报告 岗位SOP手册
编排 Orchestration 协调多个Agent协同工作 资产Agent + 漏洞Agent + 变更Agent 一起干活 项目经理
工具 Tool Agent能调用的外部功能 search_assets(), restart_server(), send_email() 员工的工具箱
知识库 Knowledge Base 给Agent参考的文档/数据 资产清单、漏洞库、等保条款的向量化存储 员工的培训手册

🔄 二、迭代开发相关概念

概念 英文 通俗解释 示意图/代码 关键点
观测层 Observation Layer 采集Agent的执行日志、用户反馈、异常 ```
👤 用户: "查不到IP"
🤖 Agent: 返回错误
📝 采集: {error: "IP not found", feedback: "点踩"}
| 复制代码
| **自优化层** | Self-Optimization Layer | 根据观测数据自动改进 | ```
旧Prompt: "返回资产信息"
新Prompt: "返回资产信息,必须包含IP"
```| 闭环核心 |
| **治理层** | Governance Layer | 人工审核、风险控制 | ```
高风险操作 → 暂停 → 通知管理员 → 审核通过 → 执行
```| 安全护栏 |
| **数据飞轮** | Data Flywheel | 越用越好的正向循环 | 更多用户 → 更多反馈 → 更好模型 → 更多用户 | 增长引擎 |
| **持续迭代** | Continuous Iteration | 不停采集→优化→上线的循环 | 每天一个小版本,每周一个大版本 | DevOps for AI |

---

## 🧠 三、人类参与相关概念

| 概念 | 英文 | 通俗解释 | 流程图 | 应用场景 |
|------|------|----------|--------|----------|
| **人在回路** | Human-in-the-Loop | 关键环节需要人参与决策 | ```
AI生成方案 → 人审核 → 通过才执行
```| 高危操作、权限变更 |
| **人类反馈** | Human Feedback | 人对AI输出进行评价 | ```
[👍 有帮助] [👎 没帮助] [✏️ 修正]
```| 强化学习数据源 |
| **强化学习** | RLHF | 用人类反馈优化模型 | 收集点踩数据 → 训练奖励模型 → 微调LLM | ChatGPT核心技术 |
| **人机协同** | Human-AI Collaboration | 人和AI互相配合 | 人定目标,AI执行;AI出方案,人决策 | 最佳实践 |
| **主动学习** | Active Learning | AI主动问人"这个对吗" | ```
AI: "这个漏洞修复方案有70%置信度,需要您确认"
```| 冷启动阶段 |

---

## 🛠️ 四、智能体能力相关概念

| 概念 | 英文 | 通俗解释 | 代码示例 | 类比 |
|------|------|----------|----------|------|
| **技能** | Skill | Agent能完成的原子能力 | ```python
@tool
def get_server_ip(name: str):
    return db.query(f"SELECT ip FROM assets WHERE name={name}")
```| 员工的单项技能 |
| **任务** | Task | 需要多步完成的复杂工作 | ```
Task: 处理服务器宕机
Steps: 1. 定位IP 2. 检查状态 3. 尝试重启 4. 通知owner
```| 员工的任务清单 |
| **规划** | Planning | Agent自己拆解任务 | ```
用户: "北京分院服务器有问题"
规划: 1. 查北京分院有哪些服务器
      2. 检查每台状态
      3. 找出异常的
```| 员工的工作计划 |
| **记忆** | Memory | 短期/长期记住信息 | ```
短期: 本轮对话内容
长期: 用户常查"北京分院",下次优先返回
```| 员工的经验 |
| **推理** | Reasoning | 根据信息得出结论 | ```
已知: db-03 CPU 92%, 运行Java应用
推理: 可能是GC问题,建议重启或调优
```| 员工的判断力 |

---

## 📝 五、函数调用相关概念

| 概念 | 英文 | 通俗解释 | 代码示例 | 说明 |
|------|------|----------|----------|------|
| **函数调用** | Function Calling | LLM决定调用哪个函数 | ```json
{
  "name": "restart_server",
  "arguments": {"ip": "10.88.3.21"}
}
```| OpenAI/ChatGLM都支持 |
| **工具调用** | Tool Calling | 同上,更通用的说法 | ```python
tools = [
    Tool(name="查资产", func=search_asset),
    Tool(name="查漏洞", func=search_vuln)
]
```| LangChain术语 |
| **结构化输出** | Structured Output | 强制LLM按格式返回 | ```python
class AssetInfo(BaseModel):
    name: str
    ip: str
    status: str
```| 用Pydantic定义 |
| **思维链** | Chain of Thought | 让LLM先思考再回答 | ```
问题: db-03 CPU高怎么办?
思考: 1. 先查是不是Java应用
      2. 查GC日志
      3. 如果是,建议重启
```| 提高准确性 |
| **ReAct模式** | Reason + Act | 思考→行动→观察循环 | ```
Thought: 需要查db-03的IP
Action: search_asset("db-03")
Observation: 10.88.3.21
Thought: IP找到了,现在可以重启
```| Agent核心模式 |

---

## 🧩 六、RAG相关概念

| 概念 | 英文 | 通俗解释 | 示意图 | 关键点 |
|------|------|----------|--------|--------|
| **检索增强生成** | RAG | 先查资料再回答问题 | ```
用户问题 → 向量检索 → 找到相关文档 → LLM生成回答
```| 解决幻觉问题 |
| **向量化** | Embedding | 把文字转成数学向量 | `"服务器" → [0.1, 0.3, -0.2, ...]` | 让计算机理解语义 |
| **向量数据库** | Vector DB | 存向量的数据库 | Chroma, PGVector, Qdrant | 快速相似性搜索 |
| **分块** | Chunking | 把长文档切成小段 | 500字一段,重叠50字 | 提高检索精度 |
| **重排序** | Reranking | 对检索结果重新排序 | 向量召回的top20,用精排模型重排取top5 | 提高准确率 |

---

## 📈 七、评估相关概念

| 概念 | 英文 | 通俗解释 | 计算公式/方法 | 目标 |
|------|------|----------|--------------|------|
| **准确率** | Accuracy | 答对的比率 | 正确数 / 总数 | 基础指标 |
| **召回率** | Recall | 该找到的都找到了吗 | 找到的相关文档 / 总相关文档 | RAG核心指标 |
| **幻觉率** | Hallucination Rate | 胡编乱造的比例 | 幻觉次数 / 总回答次数 | 安全指标 |
| **延迟** | Latency | 响应速度 | 从提问到回答的时间 | 体验指标 |
| **成本** | Cost | token消耗 | 输入token数 + 输出token数 | 经济指标 |
| **A/B测试** | A/B Testing | 对比新旧版本效果 | 50%流量旧版,50%新版,看哪个好 | 科学决策 |

---

## 🎯 八、一句话总结所有概念

智能体(Agent)通过 规划(Planning) 和 推理(Reasoning),

调用各种 工具(Tools)/技能(Skills) 完成 任务(Tasks),

过程中依赖 记忆(Memory) 和 知识库(RAG),

通过 函数调用(Function Calling) 与外部系统交互,

遵循 ReAct模式(思考→行动→观察) 循环,

最终输出 结构化结果(Structured Output)。

整个系统通过 人在回路(HITL) 收集 人类反馈(Human Feedback),

经过 观测层(Observation) → 自优化层(Optimization) → 治理层(Governance) 的

持续迭代(Continuous Iteration) 形成 数据飞轮(Data Flywheel),

用 准确率、召回率、幻觉率、延迟、成本 等指标 持续评估 效果。

复制代码
---

## 📊 九、概念关系图

┌─────────────────────────────────────────────────────────────────┐

│ 🎯 业务目标 │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🤖 智能体(Agent) │ │

│ │ ┌──────────┬──────────┬──────────┬──────────┬────────┐ │ │

│ │ │ 规划 │ 推理 │ 记忆 │ 工具 │ 知识库 │ │ │

│ │ │Planning │Reasoning │ Memory │ Tool │ RAG │ │ │

│ │ └──────────┴──────────┴──────────┴──────────┴────────┘ │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🔄 执行循环 │ │

│ │ Thought → Action → Observation → Thought ... │ │

│ │ (ReAct模式) │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 📊 观测反馈层 │ │

│ │ 用户反馈 · 执行日志 · 异常捕获 · 性能指标 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ ⚙️ 自优化层 │ │

│ │ Prompt优化 · RAG更新 · 流程修正 · 模型微调 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 🛡️ 治理层 │ │

│ │ 风险分级 · 人工审核 · 强制暂停 · 一键回滚 │ │

│ └──────────────────────────────────────────────────────────┘ │

│ │ │

│ ▼ │

│ ┌──────────────────────────────────────────────────────────┐ │

│ │ 📈 持续迭代 │ │

│ │ 每天一个小版本 · 每周一个大版本 · 永远在进化 │ │

│ └──────────────────────────────────────────────────────────┘ │

└─────────────────────────────────────────────────────────────────┘

复制代码
---

## 🔍 十、实际场景中的概念应用

### 场景:运维助手处理"服务器宕机"

1️⃣ 用户输入: "web-01好像挂了,帮我看看"

2️⃣ 智能体(Agent) 开始 规划(Planning):

  • 先查web-01的IP和状态
  • 如果真挂了,尝试重启
  • 通知负责人

3️⃣ 调用 工具(Tool):

python 复制代码
asset_info = search_asset("web-01")  # 返回 {ip: "10.88.1.12", status: "down"}

4️⃣ 推理(Reasoning):

  • 状态是down,需要重启
  • 重启是高风险操作,需要 人在回路(HITL)

5️⃣ 治理层(Governance) 拦截:

python 复制代码
risk_score = calculate_risk("restart", asset="web-01")  # 返回 85 (高风险)
if risk_score > 80:
    pause_and_notify_admin()

6️⃣ 管理员收到通知,在 治理层 审核:

  • 查看影响范围
  • 确认可以重启
  • 点击"通过"

7️⃣ 执行重启,记录到 观测层(Observation):

json 复制代码
{
  "action": "restart",
  "asset": "web-01",
  "result": "success",
  "human_approved": true,
  "time_taken": "2.3s"
}

8️⃣ 数据进入 自优化层(Optimization):

  • 类似场景下次可以半自动
  • 重启成功率100%,可以考虑降低风险分

9️⃣ 形成 数据飞轮(Data Flywheel):

  • 更多成功案例 → 模型更自信 → 处理更快 → 更多用户使用


    📝 十一、需要掌握的代码示例

    1. 定义Tool

    python 复制代码
    from langchain.tools import tool
    
    @tool
    def get_server_ip(server_name: str) -> str:
        """根据服务器名称查询IP地址"""
        # 实际从CMDB查询
        result = db.query(f"SELECT ip FROM assets WHERE name='{server_name}'")
        return result[0] if result else "未找到"

2. 定义结构化输出

python 复制代码
from pydantic import BaseModel
from typing import List

class AssetInfo(BaseModel):
    name: str
    ip: str
    status: str
    owner: str
    vulnerabilities: List[str] = []

3. ReAct Agent 核心逻辑

python 复制代码
def react_agent(query):
    thoughts = []
    while not done:
        # Thought
        thought = llm.invoke(f"当前问题:{query},历史:{thoughts},下一步该做什么?")
        thoughts.append(thought)
        
        # Action
        if "需要查资产" in thought:
            result = search_asset(query)
        elif "需要重启" in thought:
            result = call_human_for_approval("重启")  # 人在回路
        
        # Observation
        observation = f"执行结果:{result}"
        thoughts.append(observation)
        
        # 判断是否完成
        done = llm.invoke(f"根据{observation},问题解决了吗?")

4. 观测层数据采集

python 复制代码
class Observation:
    def collect_feedback(self, message_id, feedback_type, feedback_text=None):
        return {
            "message_id": message_id,
            "type": feedback_type,  # "like", "dislike", "correction"
            "text": feedback_text,
            "timestamp": datetime.now(),
            "user_id": current_user.id
        }
    
    def detect_anomaly(self, agent_log):
        # 检测异常模式
        if agent_log.error_rate > 0.2:
            alert("错误率过高", agent_log)

🎯 总结:需要重点掌握的20个概念

类别 概念 掌握程度
核心 Agent, Tool, Workflow, Orchestration ⭐⭐⭐⭐⭐
迭代 Observation, Optimization, Governance, Data Flywheel ⭐⭐⭐⭐⭐
人类 Human-in-the-Loop, RLHF, Active Learning ⭐⭐⭐⭐
能力 Planning, Reasoning, Memory, Function Calling ⭐⭐⭐⭐⭐
RAG Embedding, Vector DB, Chunking, Reranking ⭐⭐⭐⭐
评估 Accuracy, Recall, Latency, Cost ⭐⭐⭐

记住:AI时代,懂概念的人指挥AI,不懂概念的人被AI指挥。

相关推荐
LaughingZhu2 小时前
Product Hunt 每日热榜 | 2026-02-15
人工智能·经验分享·深度学习·神经网络·产品运营
带娃的IT创业者2 小时前
解密OpenClaw系列10-OpenClaw系统要求
人工智能·macos·ios·objective-c·ai智能体·智能体开发·openclaw
志栋智能2 小时前
AI驱动的数据库自动化巡检:捍卫数据王国的“智能中枢”
大数据·运维·数据库·人工智能·云原生·自动化
黑巧克力可减脂2 小时前
Vibe Coding技术方案选型:循道而行,择善而用——从古典智慧看AI编程范式的选型之道
人工智能·语言模型·软件工程·ai编程
木斯佳3 小时前
前端八股文面经大全:2026-01-23快手AI应用方向前端实习一面面经深度解析
前端·人工智能·状态模式
aircrushin3 小时前
国产大模型工业化转型:豆包2.0如何定义“数字员工”新范式
人工智能
AI浩3 小时前
EFSI-DETR:用于无人机图像实时小目标检测的高效频域 - 语义集成方法
人工智能·目标检测·无人机
上进小菜猪3 小时前
基于 YOLOv8 的无人机位置捕捉与识别检测系统 [目标检测完整源码]
人工智能
cyforkk3 小时前
YAML 配置文件中的常见陷阱:内联字典与块映射混用
人工智能·深度学习·机器学习