如何使用 OpenAI API 构建 Agents

如何使用 OpenAI API 构建 Agents

在人工智能领域,Agents 代表着能够智能完成任务的系统,其能力范围从执行简单工作流到处理复杂、开放式目标不等。OpenAI 提供了丰富的可组合基元,助力开发者构建 Agents。本文将详细介绍这些基元,以及它们如何共同构成一个强大的智能代理平台。

概述

构建 Agents 需要整合多个领域的组件,包括模型、工具、知识与记忆、音频与语音、护栏机制和编排工具,而 OpenAI 为每个领域都提供了可组合的基元。

领域 描述 OpenAI 基元
模型 具备推理、决策和处理不同模态能力的核心智能 o1、o3-mini、GPT-4.5、GPT-4o、GPT-4o-mini
工具 与世界交互的接口,包括环境交互、函数调用、内置工具等 函数调用、网络搜索、文件搜索、计算机使用
知识与记忆 增强 Agents 的外部和持久知识 向量存储、文件搜索、嵌入
音频与语音 创建能够理解音频并以自然语言回应的 Agents 音频生成、实时处理、音频代理
护栏机制 防止无关、有害或不良行为 内容审核、指令层级(Python)、指令层级(TypeScript)
编排工具 开发、部署、监控和改进 Agents Python Agents SDK、TypeScript Agents SDK、追踪、评估、微调
语音代理 创建能够理解音频并以自然语言回应的 Agents 实时 API、Python Agents SDK 中的语音支持、TypeScript Agents SDK 中的语音支持

模型

模型 智能代理优势
o3 和 o4-mini 最适合长期规划、艰巨任务和推理工作
GPT-4.1 最适合智能代理执行任务
GPT-4.1-mini 在智能代理能力和延迟之间取得良好平衡
GPT-4.1-nano 最适合低延迟场景

大型语言模型(LLMs)是许多智能代理系统的核心,负责做出决策并与世界交互。OpenAI 的模型支持广泛的功能:

  • 高智能 :能够进行推理和规划,以应对最困难的任务。
  • 工具使用调用函数并利用 OpenAI 的内置工具
  • 多模态:原生理解文本、图像、音频、代码和文档。
  • 低延迟 :支持实时音频对话以及更小、更快的模型。

有关详细的模型比较,请访问模型页面。

工具

工具使 Agents 能够与世界交互。OpenAI 支持函数调用以连接到你的代码,以及内置工具用于常见任务,如网络搜索和数据检索。

工具 描述
函数调用 与开发者定义的代码交互
网络搜索 从网络获取最新信息
文件搜索 对文档进行语义搜索
计算机使用 理解和控制计算机或浏览器
本地 shell 在本地机器上执行命令

在实际开发中,调用这些工具时,合理设置 API 地址能带来更稳定的体验。例如,可将 baseurl 设置为 api.aaaaapi.com ,通过专业的中转服务提升接口调用效率,你也可以通过 相关平台 了解更多适合自己开发场景的配置方案。

知识与记忆

知识和记忆帮助 Agents 存储、检索和利用超出其初始训练数据的信息。向量存储 使 Agents 能够对文档进行语义搜索,并在运行时检索相关信息。同时,嵌入 高效地表示数据以便快速检索,为动态知识解决方案和 Agents 的长期记忆提供支持。你可以使用 OpenAI 的向量存储嵌入 API 整合数据。

护栏机制

护栏机制确保 Agents 的行为安全、一致,并在预期范围内------这对于生产部署至关重要。使用 OpenAI 免费的内容审核 API 自动过滤不安全内容。通过利用指令层级,可以进一步控制 Agents 的行为,该层级优先考虑开发者定义的提示,并减少不必要的 Agents 行为。

编排工具

构建 Agents 是一个过程。OpenAI 提供了有效构建、部署、监控、评估和改进智能代理系统的工具。

阶段 描述 OpenAI 基元
构建与部署 使用 Agents SDK 快速构建 Agents、实施护栏机制并处理对话流程 Agents SDK Python、Agents SDK TypeScript
监控 通过追踪实时观察 Agents 行为、调试问题并获取见解 追踪
评估与改进 衡量 Agents 性能、确定改进领域并优化 Agents 评估、微调

开始使用

Python

bash 复制代码
pip install openai-agents

查看文档

查看我们的文档,了解有关如何开始使用 Python Agents SDK 的更多信息。

查看 Python 仓库

OpenAI Agents SDK for Python 是开源的。查看我们的仓库以获取实现细节和示例集合。

TypeScript/JavaScript

bash 复制代码
npm install @openai/agents

查看文档

查看我们的文档,了解有关如何开始使用 TypeScript Agents SDK 的更多信息。

查看代码

OpenAI Agents SDK for TypeScript 是开源的。查看我们的仓库以获取实现细节和示例集合。

相关推荐
热河暖男2 小时前
Spring Boot AI 极速入门:解锁智能应用开发
java·人工智能·spring boot·ai编程
安思派Anspire16 小时前
GraphRAG 工作原理分步解析(二)
aigc·openai·agent
罖亽94116 小时前
使用工具:扩展模型能力的实用指南
openai
Keegan小钢17 小时前
链上ETF研发日志 #4:合约部署完成
web3·ai编程·claude
阿加犀智能18 小时前
高通手机跑AI系列之——实时头发识别
python·ai编程
数据智能老司机18 小时前
精通ROS 2机器人编程——ROS 2入门
机器人·ai编程·编程语言
Jacob023421 小时前
UI 代码不写也行?我用 MCP Server 和 ShadCN 自动生成前端界面
前端·llm·ai编程
玄明Hanko21 小时前
从需求、开发、测试到运维,程序员效率飙升的秘密曝光
人工智能·ai编程
玄明Hanko21 小时前
百度开源 ERNIE 4.5,将给国内大模型生态带来哪些影响
人工智能·文心一言·ai编程