Agent-S 安装使用教程:自动操作电脑的 AI

|---|
| |

|----------------------------------------------------------|
| 🤖 ## Agent-S 安装使用教程 首个超越人类的计算机操作 AI,让电脑自己干活 ⭐ 9.4K Star |

|---|
| |

🚀 项目介绍

Agent-S 是由 Simular AI 开发的开源框架,让 AI 能够像人类一样操作电脑。它可以:

|--------------------------------|
| ✅ 自动点击鼠标 - 识别屏幕元素并精准点击 |
| ✅ 自动敲键盘 - 输入文字、执行快捷键 |
| ✅ 自主思考决策 - 根据任务目标规划操作步骤 |
| ✅ 执行复杂任务 - 浏览网页、编辑文档、整理文件等 |

△ Agent-S 在 GitHub 上获得 9.4K Star

|---------------------------------------------------------------|
| **🏆 首个超越人类!**Agent-S 在 OSWorld 基准测试中达到 72.60% 的成功率,首次超越人类水平。 |

项目信息 详情
GitHub 地址 github.com/simular-ai/Agent-S
支持平台 Windows / macOS / Linux
开源协议 Apache 2.0
Star 数量 9.4K+

|---|
| |

📋 环境要求

在安装之前,请确保您的电脑满足以下条件:

要求 说明
操作系统 Windows 10+、macOS 10.15+、Ubuntu 20.04+
Python 3.8 或更高版本
Git 用于克隆代码仓库
API 密钥 OpenAI / Anthropic / Hugging Face(至少一个)

|-------------------------------------------------------------------|
| **⚠️ Linux 用户注意:**建议直接在系统环境下操作,避免使用 conda 环境,因为可能与 pyatspi 库产生冲突。 |

|---|
| |

⚙️ 安装步骤

|---|---------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | 克隆代码仓库 打开终端,执行以下命令: |---------------------------------------------------------------------| | git clone https://github.com/simular-ai/Agent-S.git cd Agent-S | |

|---|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 2 | 创建虚拟环境(推荐) 为了避免依赖冲突,建议创建独立的虚拟环境: |----------------------------------------------------------------------------------------------------------------------------------------| | # 创建虚拟环境 python -m venv venv # 激活虚拟环境(Windows) venv\Scripts\activate # 激活虚拟环境(macOS / Linux) source venv/bin/activate | |

|---|----------------------------------------------------------------------------|
| 3 | 安装依赖包 使用 pip 安装: |--------------------------| | pip install gui-agents | |

|---|
| |

🔑 配置 API 密钥

Agent-S 需要调用大语言模型 API 来实现智能决策。您需要至少配置以下一个 API 密钥:

服务商 推荐模型
OpenAI GPT-4o
Anthropic Claude 3.5 Sonnet
Hugging Face 开源模型

Windows 设置环境变量:

|---------------------------------------------------------------------------------------------------|
| $env:OPENAI_API_KEY="sk-your-api-key-here" $env:ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |

macOS / Linux 设置环境变量:

|-------------------------------------------------------------------------------------------------------|
| export OPENAI_API_KEY="sk-your-api-key-here" export ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |

|---|
| |

💻 命令行使用

安装完成后,您可以通过 gui-agents 命令来启动 Agent-S:

基本用法:

|--------------------------------------------------|
| gui-agents --instruction "打开计算器,计算 123 乘以 456" |

任务示例:

任务类型 示例指令
应用操作 "打开记事本,写入 Hello World 并保存"
网页浏览 "打开浏览器,搜索 Python 教程"
文件管理 "创建一个名为 test 的文件夹"
复杂任务 "打开 Excel,创建包含姓名和年龄的表格"

|---------------------------------------------------------------------|
| **⚠️ 安全提醒:**Agent-S 会直接在您的电脑上执行操作。请确保在安全可控的环境下运行,并时刻监控其行为,避免执行危险操作。 |

|---|
| |

❓ 常见问题

Q1: 安装时提示 pip 找不到包?

确保您使用的是 Python 3.8+ 版本,并且已激活正确的虚拟环境。可以使用 python --version 检查版本。

Q2: 运行时提示 API Key 未配置?

请检查环境变量是否正确设置。重启终端后环境变量才会生效。

Q3: Agent-S 操作速度很慢?

这可能是因为网络延迟导致 API 调用较慢,或任务过于复杂需要多步规划。可以尝试使用更快的模型。

Q4: 如何停止正在运行的任务?

按 Ctrl + C 可以中断当前任务。建议在任务执行期间保持监控,随时准备中断。

|---------------------------------------------------------------------|
| IT超新鲜 专注AI原理可视化科普,用动画讲清楚复杂技术! GitHub: github.com/simular-ai/Agent-S |

相关推荐
冬奇Lab14 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab14 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩15 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒16 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海16 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠16 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao16 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
程序员cxuan17 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
机器之心17 小时前
AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能·openai