如何使用 OpenAI API 构建 Agents
在人工智能领域,Agents 代表着能够智能完成任务的系统,其能力范围从执行简单工作流到处理复杂、开放式目标不等。OpenAI 提供了丰富的可组合基元,助力开发者构建 Agents。本文将详细介绍这些基元,以及它们如何共同构成一个强大的智能代理平台。
概述
构建 Agents 需要整合多个领域的组件,包括模型、工具、知识与记忆、音频与语音、护栏机制和编排工具,而 OpenAI 为每个领域都提供了可组合的基元。
领域 | 描述 | OpenAI 基元 |
---|---|---|
模型 | 具备推理、决策和处理不同模态能力的核心智能 | o1、o3-mini、GPT-4.5、GPT-4o、GPT-4o-mini |
工具 | 与世界交互的接口,包括环境交互、函数调用、内置工具等 | 函数调用、网络搜索、文件搜索、计算机使用 |
知识与记忆 | 增强 Agents 的外部和持久知识 | 向量存储、文件搜索、嵌入 |
音频与语音 | 创建能够理解音频并以自然语言回应的 Agents | 音频生成、实时处理、音频代理 |
护栏机制 | 防止无关、有害或不良行为 | 内容审核、指令层级(Python)、指令层级(TypeScript) |
编排工具 | 开发、部署、监控和改进 Agents | Python Agents SDK、TypeScript Agents SDK、追踪、评估、微调 |
语音代理 | 创建能够理解音频并以自然语言回应的 Agents | 实时 API、Python Agents SDK 中的语音支持、TypeScript Agents SDK 中的语音支持 |
模型
模型 | 智能代理优势 |
---|---|
o3 和 o4-mini | 最适合长期规划、艰巨任务和推理工作 |
GPT-4.1 | 最适合智能代理执行任务 |
GPT-4.1-mini | 在智能代理能力和延迟之间取得良好平衡 |
GPT-4.1-nano | 最适合低延迟场景 |
大型语言模型(LLMs)是许多智能代理系统的核心,负责做出决策并与世界交互。OpenAI 的模型支持广泛的功能:
- 高智能 :能够进行推理和规划,以应对最困难的任务。
- 工具使用 :调用函数并利用 OpenAI 的内置工具。
- 多模态:原生理解文本、图像、音频、代码和文档。
- 低延迟 :支持实时音频对话以及更小、更快的模型。
有关详细的模型比较,请访问模型页面。
工具
工具使 Agents 能够与世界交互。OpenAI 支持函数调用以连接到你的代码,以及内置工具用于常见任务,如网络搜索和数据检索。
工具 | 描述 |
---|---|
函数调用 | 与开发者定义的代码交互 |
网络搜索 | 从网络获取最新信息 |
文件搜索 | 对文档进行语义搜索 |
计算机使用 | 理解和控制计算机或浏览器 |
本地 shell | 在本地机器上执行命令 |
在实际开发中,调用这些工具时,合理设置 API 地址能带来更稳定的体验。例如,可将 baseurl 设置为 api.aaaaapi.com ,通过专业的中转服务提升接口调用效率,你也可以通过 相关平台 了解更多适合自己开发场景的配置方案。
知识与记忆
知识和记忆帮助 Agents 存储、检索和利用超出其初始训练数据的信息。向量存储 使 Agents 能够对文档进行语义搜索,并在运行时检索相关信息。同时,嵌入 高效地表示数据以便快速检索,为动态知识解决方案和 Agents 的长期记忆提供支持。你可以使用 OpenAI 的向量存储和嵌入 API 整合数据。
护栏机制
护栏机制确保 Agents 的行为安全、一致,并在预期范围内------这对于生产部署至关重要。使用 OpenAI 免费的内容审核 API 自动过滤不安全内容。通过利用指令层级,可以进一步控制 Agents 的行为,该层级优先考虑开发者定义的提示,并减少不必要的 Agents 行为。
编排工具
构建 Agents 是一个过程。OpenAI 提供了有效构建、部署、监控、评估和改进智能代理系统的工具。

阶段 | 描述 | OpenAI 基元 |
---|---|---|
构建与部署 | 使用 Agents SDK 快速构建 Agents、实施护栏机制并处理对话流程 | Agents SDK Python、Agents SDK TypeScript |
监控 | 通过追踪实时观察 Agents 行为、调试问题并获取见解 | 追踪 |
评估与改进 | 衡量 Agents 性能、确定改进领域并优化 Agents | 评估、微调 |
开始使用
Python
bash
pip install openai-agents
查看我们的文档,了解有关如何开始使用 Python Agents SDK 的更多信息。
OpenAI Agents SDK for Python 是开源的。查看我们的仓库以获取实现细节和示例集合。
TypeScript/JavaScript
bash
npm install @openai/agents
查看我们的文档,了解有关如何开始使用 TypeScript Agents SDK 的更多信息。
OpenAI Agents SDK for TypeScript 是开源的。查看我们的仓库以获取实现细节和示例集合。