AI Agent的主流设计模式之工具调用模式

为什么需要工具调用?

LLM本质上是"静态"的,它的知识截止于训练数据,且无法直接与外部世界交互。工具调用就是为了解决LLM的三大核心局限:

  1. 信息滞后性:无法获取实时信息(如今天天气、最新新闻、股票价格)。

  2. 能力边界:无法执行具体操作(如发送邮件、控制智能家居、预订餐厅)。

  3. 计算与精确性:不擅长精确计算或逻辑推理(如数学计算、代码执行)。

通过工具调用,Agent获得了"手"和"眼睛",可以像人一样使用计算器、浏览器、API来完成任务。

python 复制代码
from openai import OpenAI
import json
import random
import os

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"  # 阿里云兼容模式地址
)

# 1. 定义工具列表
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_current_weather",
            "description": "查询指定城市的天气",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {"type": "string", "description": "城市名称"}
                },
                "required": ["location"]
            }
        }
    }
]

# 2. 模拟工具函数
def get_current_weather(arguments):
    location = json.loads(arguments)["location"] if isinstance(arguments, str) else arguments["location"]
    weather = random.choice(["晴天", "多云", "小雨"])
    return f"今天{location}的天气是{weather}。"

# 3. 对话流程
messages = [{"role": "user", "content": "南京天气怎么样?"}]
response = client.chat.completions.create(
    model="qwen-plus",  # 也可用 qwen-max, qwen-turbo 等
    messages=messages,
    tools=tools
)

assistant_msg = response.choices[0].message
messages.append(assistant_msg)

# 4. 如果模型要求调用工具
if assistant_msg.tool_calls:
    tool_call = assistant_msg.tool_calls[0]
    func_name = tool_call.function.name
    func_args = json.loads(tool_call.function.arguments)
    print(f"调用工具:{func_name},参数:{func_args}")
    # 执行本地工具函数
    tool_result = get_current_weather(func_args)
    # 将工具结果返回给模型
    messages.append({
        "role": "tool",
        "tool_call_id": tool_call.id,
        "content": tool_result
    })
    # 第二次调用模型生成最终回答
    final_response = client.chat.completions.create(
        model="qwen-plus",
        messages=messages,
        tools=tools
    )
    print(f"最终回答:{final_response.choices[0].message.content}")
相关推荐
树獭叔叔2 小时前
04-残差连接与Pre-LN:让大模型的深度网络成为可能
后端·aigc·openai
小雨中_2 小时前
4.1 Megatron-LM:千卡级集群预训练的“硬核”框架
人工智能·python·深度学习·机器学习·llama
小熊巨离谱2 小时前
🔥从聊天到干活:三分钟搞懂 LLM、Agent、RAG、Skill
aigc
肾透侧视攻城狮2 小时前
【效率革命】《TensorFlow分布式训练:攻克内存瓶颈与通信延迟的实战方案》
人工智能·深度学习·tensorflow分布式训练·分布式策略·数据/模型并行·多机配置/自定义训练循环·内存不足/设备间通信瓶颈
高洁012 小时前
多模态大模型的统一表征与推理范式
人工智能·python·深度学习·机器学习·transformer
ppppppatrick2 小时前
【深度学习基础篇05】从AlexNet到ResNet:经典卷积神经网络的演进
人工智能·深度学习·cnn
storyseek3 小时前
使用迁移学习来训练VGG模型
深度学习·机器学习·迁移学习
LaughingZhu3 小时前
Product Hunt 每日热榜 | 2026-02-23
人工智能·经验分享·深度学习·神经网络·产品运营
qq_24218863323 小时前
AI内容审核系统(简化版实现)
人工智能·深度学习·目标检测