AI Agent开发，如何调用三方的API Function，是通过提示词来发起调用的吗

最近在研究AI Agent如何调用三方API，整理了一篇文章，分享给大家。

调用三方 API（Function Calling）不是通过提示词（Prompt）来实现的，而是通过函数调用机制（Function Calling），具体流程如下：

1. 模型识别调用需求

大模型在解析用户输入时，会判断是否需要调用某个 API。如果需要，它不会直接生成文本回复，而是调用一个已注册的函数（Function）。

2. API 方法注册

开发者需要在调用API 时，预先定义可用的 API 函数，并提供：

函数名称 （如 get_weather）
参数定义（使用 JSON Schema 描述参数结构）
描述信息（帮助大模型理解函数用途）

复制代码

{
  "name": "get_weather",
  "description": "获取某个城市的天气信息",
  "parameters": {
    "type": "object",
    "properties": {
      "city": {
        "type": "string",
        "description": "城市名称"
      }
    },
    "required": ["city"]
  }
}

3. 大模型生成函数调用请求

当用户输入类似：

"北京今天的天气怎么样？"

大模型会解析出：

复制代码

{
  "name": "get_weather",
  "arguments": {
    "city": "北京"
  }
}

4. AI Agent/程序调用三方 API 并返回结果

AI Agent/程序中，可以：

调用实际的 API（如天气服务 API）
获取数据
将数据附加到Prompt中返回给大模型继续处理

示例：

复制代码

{
  "temperature": "15°C",
  "weather": "晴天"
}

5. 大模型解析结果并返回最终文本

大模型处理 API 返回的数据，并生成自然语言回复给用户：

"北京今天是晴天，气温 15°C。"

总结

不是通过提示词（Prompt）来调用 API，而是通过函数调用机制
开发者需要预先注册 API 函数
大模型识别需求后，自动构造 API 调用参数
开发者负责执行 API 请求，并将结果返回 GPT
大模型解析 API 结果并生成最终用户可读的回复

周国庆

2025/03/16