LLMs之Agent:ChatGPT Agent发布---统一代理系统将研究与行动无缝对接,开启智能助理新时代
目录
[OpenAI重磅发布ChatGPT Agent---统一代理系统将研究与行动无缝对接,开启智能助理新时代](#OpenAI重磅发布ChatGPT Agent—统一代理系统将研究与行动无缝对接,开启智能助理新时代)
[第一部分:Operator 和深度研究的自然演进](#第一部分:Operator 和深度研究的自然演进)
OpenAI 重磅发布ChatGPT Agent---统一代理系统将研究与行动无缝对接,开启智能助理新时代
|------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 地址 | 地址:https://openai.com/index/introducing-chatgpt-agent/ |
| 时间 | 2025年7月17日 |
| 作者 | OpenAI |


第一部分:Operator 和深度研究的自然演进
OpenAI 将此前独立的 Operator(可在网页上进行点击、滚动、输入等交互操作)与深度研究模型(擅长信息综合与生成长文报告)合并,形成一个统一的代理系统,使模型既能深入分析信息,又能主动在网页上执行操作,解决了两者各自的局限性。
核心要点
>> 互补优势融合 :Operator 擅长网页交互,而深度研究擅长信息汇总;二者合并后,模型能够同时完成访问信息和深度分析的全过程。
>> 主动式任务执行 :新系统不再仅仅生成文本,而是能够"思考并行动",根据用户指令主动在虚拟浏览器中执行一系列操作。
>> 无缝切换模式 :用户可在同一对话中,从简单对话自由过渡到要求模型执行具体操作,流程自然流畅。
经验与技巧
>> 在实际应用时,可先让模型简单浏览网页(文本模式),如需下载文件或登录,切换至可视化浏览器并授权"接管"模式。
>> 对于需要深度报告的任务,明确告知模型所需分析深度与格式,充分利用其深度研究能力。
第二部分:一个与您协作、为您工作的智能代理
ChatGPT Agent 提供了一套多样化工具,包括可视化浏览器、文本浏览器、终端和 API 连接器,可根据任务需求灵活选择最优执行路径,并能连接 Gmail、GitHub 等应用,实现与现有工作流的无缝集成。
核心要点
>> 多元化工具箱 :可视化浏览器用于处理以人类为设计对象的网站,文本浏览器便于大规模文本检索与分析,终端可运行代码,API 连接器可访问日历、收件箱等私有数据。
>> 虚拟计算机环境 :所有操作均在独立的虚拟机中进行,保持任务上下文一致,无需用户来回切换环境。
>> 实时协作与中断可控:用户可随时中断、澄清指令或接管浏览器,模型会保留已有进度并根据新指示继续执行。
经验与技巧
>> 在需要处理敏感数据时,先在浏览器中"接管"登录,确保 API 连接器仅用于读取权限而不开放过度控制。
>> 面对多步骤任务,可将每一步拆分,引导模型先规划再执行,以降低因一次性复杂指令带来的错误风险。
第三部分:拓展真实世界的实用性
Agent 能自动执行工作场景中的重复性任务(如将仪表盘转换为可编辑的演示文稿、更新财务表格)以及个人场景中的生活规划(如旅行行程、晚宴规划、预约安排),大幅提升效率。
核心要点
>> 职场自动化 :准备演示文稿、整理会议日程、生成财务模型、构建竞争分析报告等,模型输出可直接编辑。
>> 个人助理 :规划和预订旅行、菜品采购与烹饪计划、专家预约等一应俱全。
>> SOTA 性能:在 Humanity's Last Exam(41.6 pass@1)和 FrontierMath(27.4% 正确率)、内部知识工作基准、DSBench、SpreadsheetBench(45.5%)等评测中多项领先。

经验与技巧
>> 针对专业任务,可参考Benchmark的示例指令,确保模型在关键步骤(如数据下载、图表生成)中采用正确工具。
>> 在对比多种方案时,利用并行多次尝试(parallel rollout)提高成功率,并通过自信度指标选出最佳结果。
第四部分:使用方式
用户可在对话界面的工具下拉菜单中,随时切换至"agent mode",描述所需任务并监控模型的每一步操作,还能设置定期自动执行(如每周报告)。
使用地址 :https://chatgpt.com/?openaicom-did=bdc39a56-270f-4ce0-9f6c-1736d412fe83&openaicom_referred=true
核心要点
>> 一键启用与描述 :选择"agent mode"后,用自然语言描述任务要求。
>> 操作可视化 :执行过程中,屏幕上实时展示模型执行步骤,可中途插入指令或接管操作。
>> 任务调度:支持定期任务,如每周自动生成并发送报告。
经验与技巧
>> 在首次使用时,可先让模型执行一遍示例任务,熟悉"屏幕叙述"流程与中断机制。
****>>****对于周期性强的工作,提前配置好模板(例如 PowerPoint、电子表格),并设置自动调度,最大化节省操作时间。
第五部分:新能力带来的新风险
ChatGPT Agent 可直接在网页上执行操作并访问用户数据,虽然配备了多层次安全控制,但整体风险相较于仅生成内容的模型有所提升,需要用户在使用时谨慎衡量。
核心要点
>> 提示注入风险 :恶意页面可通过隐藏提示操控模型行为,可能导致敏感数据泄露或误操作。
>> 误操作风险 :在执行真实交易或发送电子邮件等关键操作前,模型会主动请求用户确认;但用户仍需保持警惕。
>> 数据隐私控制 :提供一键删除浏览数据与退出所有会话的功能,且"接管模式"下模型不存储用户输入(如密码)。
经验与技巧
>> 勿在未审查过的网址或可疑网页上启用 Agent;对于高风险操作,务必手动确认所有请求。
>> 定期清理浏览数据,并仅在必要时启用连接器,遵循最小权限原则。
第六部分:最强生物风险安全防护
鉴于模型具备执行命令、运行代码等能力,OpenAI 将 Agent 定为"高生物与化学能力"级别,部署了最全面的生物安全防护措施,并与外部专家合作持续强化安全评估与监测。
核心要点
>> 威胁建模与 双重拒绝训练 :对潜在双用途生物技术攻击场景进行全面建模与训练。
>> 实时分类与监控 :持续监测生成内容,防止双用途信息泄露。
>> 生态协作:与政府、学术机构和 NGO 合作举办研讨会,确保全球范围的生物安全防护。
经验与技巧
****>>****在涉及生物或化学敏感话题时,倾向使用更严格的"深度研究"模式,以获得更详细的风险评估与安全建议。
第七部分:可用性
ChatGPT Agent 自 2025 年 7 月 17 日起面向 Pro、Plus 和 Team 用户逐步开放,Pro 用户当日可用,每月配额 400 次,Plus/Team 用户每月 40 次;Enterprise、教育版将于数周内上线,欧洲地区正在适配中。
核心要点
>> 分层配额 :Pro:400 消息/月;Plus/Team:40 消息/月,可额外购买。
>> 区域差异 :欧洲经济区与瑞士用户暂未开放,需要等待后续迭代。
>> Operator 研究版日落:深度研究功能集成至 Agent,下线前可继续通过下拉菜单访问。
经验与技巧
****>>****Pro 用户可根据需求灵活分配配额,团队可统一购买信用点以满足高频使用场景。
第八部分:局限性与未来展望
当前版本仍处于早期阶段,幻灯片生成功能为 Beta,格式美观度与细节打磨尚需改进;未来将持续增强模型效率、深度与多样性,优化用户监督体验。
核心要点
>> 幻灯片功能 :目前可生成基本结构,可编辑性强,但导出与预览偶有差异。
>> 表格编辑 :已支持上传现有电子表格,但幻灯片模板导入功能尚未上线。
>> 持续迭代:下一个版本将重点提升输出精度、格式优化与监督需求平衡。
经验与技巧
>> 对于正式演示,目前建议先让 Agent 生成初稿,再由人工优化排版与视觉元素;
****>>****密切关注后续更新公告,及时体验新功能与改进。