OS-Copilot：实现具有自我完善能力的通用计算机智能体

叶庭云2024-03-14 17:45

🍉 CSDN 叶庭云：https://yetingyun.blog.csdn.net/

AI 缩小了人类间的知识和技术差距

论文标题：OS-Copilot: Towards Generalist Computer Agents with Self-Improvement

项目主页：https://os-copilot.github.io/

作者 & 机构：Zhiyong Wu, Chengcheng Han, Zichen Ding, Zhenmin Weng, Zhoumianze Liu, Shunyu Yao, Tao Yu, Lingpeng Kong（上海人工智能实验室 & 华东师范大学 & 普林斯顿大学 & 香港大学）

这项研究介绍了 OS-Copilot，这是一个用于构建通用计算机智能体的框架，可以与操作系统中的各种元素（包括网络、代码终端、文件、多媒体和第三方应用程序）进行交互。FRIDAY 是一种自我完善的具身智能体，在通用人工智能助手的基准测试中，FRIDAY 的表现比以前的方法高出 35%。FRIDAY 对未见过的应用程序具有很强的泛化能力，并能在极少的监督下学会控制 Excel 和 Powerpoint 并进行自我改进。

论文的关键点：

OS-Copilot 框架：旨在帮助构建操作系统级别的语言智能体，包括规划器、配置器和执行器等模块化实现。
FRIDAY 智能体：一个自我改进的具身智能体，能够自动执行通用计算机任务，并在 GAIA 基准测试中表现优异。
自我指导学习：FRIDAY 通过尝试和错误积累工具和语义知识，从而掌握新的知识和技能。

论文的主要贡献：

介绍了 OS-Copilot，这是一个用于构建通用计算机智能体的框架，能够与操作系统中的各种元素（包括网络、代码终端、文件、多媒体和各种第三方应用程序）进行交互。
该框架使 FRIDAY 成为可能，FRIDAY 是一种自我完善的具身智能体，在通用人工智能助手的基准测试中，FRIDAY 的表现比以前的方法高出 35%。FRIDAY 通过从以前的任务中积累技能，对未见过的应用表现出很强的泛化能力。
FRIDAY 在 Excel 和 Powerpoint 上的实际表现证明了它在特定应用中的控制和自我改进能力。
OS-Copilot 可作为未来研究的基础平台，用于个性化数字助理、多模态智能体和情景环境下的智能体学习等领域。