从零搭建一个AI Agent:Python实战指南

2026年最火的概念之一就是AI Agent------让大模型不再只是聊天机器人,而是能自主规划、调用工具、完成复杂任务的智能体。本文用纯Python从零实现一个可用的Agent,不依赖任何框架。

Agent的核心循环

Agent的本质就一个循环:思考→行动→观察→再思考。

复制代码
用户输入 → LLM推理 → 决定是否调用工具 → 执行工具 → 观察结果 → 继续推理 → 输出

最小实现

python 复制代码
import json
from openai import OpenAI

client = OpenAI()  # 确保API key已配置

# 定义工具
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "获取指定城市的天气",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "城市名称"}
                },
                "required": ["city"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "calculate",
            "description": "执行数学计算",
            "parameters": {
                "type": "object",
                "properties": {
                    "expression": {"type": "string", "description": "数学表达式"}
                },
                "required": ["expression"]
            }
        }
    }
]

# 工具实现
def get_weather(city: str) -> str:
    # 实际项目中接入天气API
    return f"{city}今天晴,气温22°C"

def calculate(expression: str) -> str:
    try:
        result = eval(expression)  # 生产环境请用安全解析器
        return str(result)
    except Exception as e:
        return f"计算错误: {e}"

TOOL_MAP = {
    "get_weather": get_weather,
    "calculate": calculate,
}

def run_agent(user_input: str, max_steps: int = 5) -> str:
    messages = [{"role": "user", "content": user_input}]

    for step in range(max_steps):
        response = client.chat.completions.create(
            model="gpt-4o",
            messages=messages,
            tools=tools,
            tool_choice="auto"
        )

        msg = response.choices[0].message
        messages.append(msg)

        # 没有工具调用,直接返回结果
        if not msg.tool_calls:
            return msg.content

        # 执行工具调用
        for tool_call in msg.tool_calls:
            fn_name = tool_call.function.name
            fn_args = json.loads(tool_call.function.arguments)

            print(f"  🔧 调用工具: {fn_name}({fn_args})")
            result = TOOL_MAP[fn_name](**fn_args)

            messages.append({
                "role": "tool",
                "tool_call_id": tool_call.id,
                "content": result
            })

    return "达到最大步数限制"

实际运行

python 复制代码
# 简单查询
print(run_agent("北京天气怎么样?"))
# 🔧 调用工具: get_weather({'city': '北京'})
# 北京今天晴,气温22°C

# 多步推理
print(run_agent("北京和上海哪个更暖和?"))
# 🔧 调用工具: get_weather({'city': '北京'})
# 🔧 调用工具: get_weather({'city': '上海'})
# 根据查询结果,上海今天25°C,北京22°C,上海更暖和

加上记忆系统

单轮Agent只是开始。真正的Agent需要跨对话记住信息:

python 复制代码
import sqlite3

class AgentMemory:
    def __init__(self, db_path: str = "agent_memory.db"):
        self.conn = sqlite3.connect(db_path)
        self.conn.execute("""
            CREATE TABLE IF NOT EXISTS memories (
                id INTEGER PRIMARY KEY,
                key TEXT UNIQUE,
                value TEXT,
                created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
            )
        """)
        self.conn.commit()

    def save(self, key: str, value: str):
        self.conn.execute(
            "INSERT OR REPLACE INTO memories (key, value) VALUES (?, ?)",
            (key, value)
        )
        self.conn.commit()

    def recall(self, key: str) -> str | None:
        row = self.conn.execute(
            "SELECT value FROM memories WHERE key = ?", (key,)
        ).fetchone()
        return row[0] if row else None

    def list_all(self) -> list[dict]:
        rows = self.conn.execute(
            "SELECT key, value FROM memories ORDER BY created_at DESC LIMIT 20"
        ).fetchall()
        return [{"key": r[0], "value": r[1]} for r in rows]

把记忆工具加入Agent的tools列表,Agent就能自主决定什么时候存取信息了。

关键设计原则

  1. 工具描述要精确------LLM根据description决定何时调用,描述模糊会导致错误调用
  2. 限制最大步数------防止死循环,5-10步足够大多数任务
  3. 错误处理要优雅------工具失败时返回有意义的错误信息,而不是抛异常
  4. 用streaming提升体验------长推理过程让用户看到中间输出

与框架对比

方案 灵活性 学习成本 适合场景
纯Python(本文) 最高 定制化Agent
LangChain Agent 中等 标准化工作流
CrewAI 较低 中等 多Agent协作
Dify 最低 零代码搭建

先用纯Python搞懂原理,再用框架提效,这是最稳的学习路径。

相关推荐
右耳朵猫AI13 分钟前
Rust技术周刊 2026年第19周
开发语言·后端·rust
swipe31 分钟前
LangSmith 全链路观测:从 Agent 调试到 RAG 量化评估
后端·面试·llm
我是一颗柠檬44 分钟前
【Redis】字符串与哈希Day3(2026年)
数据库·redis·后端·database
swipe44 分钟前
Neo4j + Graph RAG 工程实践:RAG 真正缺的不是更多文本,而是可查询的关系
后端·面试·llm
神奇小汤圆1 小时前
告别OOM焦虑:Flink 内存模型原理与诊断调优
后端
神奇小汤圆1 小时前
Kafka性能调优:从10万到100万条/秒的实战经验
后端
Gopher_HBo1 小时前
接入层LVS
后端
404号扳手1 小时前
Java 基础知识(六)
java·后端
前端市界2 小时前
LotDB Vue 阿里云 ECS 部署实战记录
后端
卷无止境2 小时前
SimPy 进程通信:让仿真世界里的"对话"变得优雅
后端