|---|
| |
|----------------------------------------------------------|
| 🤖 ## Agent-S 安装使用教程 首个超越人类的计算机操作 AI,让电脑自己干活 ⭐ 9.4K Star |
|---|
| |
🚀 项目介绍
Agent-S 是由 Simular AI 开发的开源框架,让 AI 能够像人类一样操作电脑。它可以:
|--------------------------------|
| ✅ 自动点击鼠标 - 识别屏幕元素并精准点击 |
| ✅ 自动敲键盘 - 输入文字、执行快捷键 |
| ✅ 自主思考决策 - 根据任务目标规划操作步骤 |
| ✅ 执行复杂任务 - 浏览网页、编辑文档、整理文件等 |

△ Agent-S 在 GitHub 上获得 9.4K Star
|---------------------------------------------------------------|
| **🏆 首个超越人类!**Agent-S 在 OSWorld 基准测试中达到 72.60% 的成功率,首次超越人类水平。 |
| 项目信息 | 详情 |
|---|---|
| GitHub 地址 | github.com/simular-ai/Agent-S |
| 支持平台 | Windows / macOS / Linux |
| 开源协议 | Apache 2.0 |
| Star 数量 | 9.4K+ |
|---|
| |
📋 环境要求
在安装之前,请确保您的电脑满足以下条件:
| 要求 | 说明 |
|---|---|
| 操作系统 | Windows 10+、macOS 10.15+、Ubuntu 20.04+ |
| Python | 3.8 或更高版本 |
| Git | 用于克隆代码仓库 |
| API 密钥 | OpenAI / Anthropic / Hugging Face(至少一个) |
|-------------------------------------------------------------------|
| **⚠️ Linux 用户注意:**建议直接在系统环境下操作,避免使用 conda 环境,因为可能与 pyatspi 库产生冲突。 |
|---|
| |
⚙️ 安装步骤
|---|---------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | 克隆代码仓库 打开终端,执行以下命令: |---------------------------------------------------------------------| | git clone https://github.com/simular-ai/Agent-S.git cd Agent-S | |
|---|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 2 | 创建虚拟环境(推荐) 为了避免依赖冲突,建议创建独立的虚拟环境: |----------------------------------------------------------------------------------------------------------------------------------------| | # 创建虚拟环境 python -m venv venv # 激活虚拟环境(Windows) venv\Scripts\activate # 激活虚拟环境(macOS / Linux) source venv/bin/activate | |
|---|----------------------------------------------------------------------------|
| 3 | 安装依赖包 使用 pip 安装: |--------------------------| | pip install gui-agents | |
|---|
| |
🔑 配置 API 密钥
Agent-S 需要调用大语言模型 API 来实现智能决策。您需要至少配置以下一个 API 密钥:
| 服务商 | 推荐模型 |
|---|---|
| OpenAI | GPT-4o |
| Anthropic | Claude 3.5 Sonnet |
| Hugging Face | 开源模型 |
Windows 设置环境变量:
|---------------------------------------------------------------------------------------------------|
| $env:OPENAI_API_KEY="sk-your-api-key-here" $env:ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |
macOS / Linux 设置环境变量:
|-------------------------------------------------------------------------------------------------------|
| export OPENAI_API_KEY="sk-your-api-key-here" export ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |
|---|
| |
💻 命令行使用
安装完成后,您可以通过 gui-agents 命令来启动 Agent-S:
基本用法:
|--------------------------------------------------|
| gui-agents --instruction "打开计算器,计算 123 乘以 456" |
任务示例:
| 任务类型 | 示例指令 |
|---|---|
| 应用操作 | "打开记事本,写入 Hello World 并保存" |
| 网页浏览 | "打开浏览器,搜索 Python 教程" |
| 文件管理 | "创建一个名为 test 的文件夹" |
| 复杂任务 | "打开 Excel,创建包含姓名和年龄的表格" |
|---------------------------------------------------------------------|
| **⚠️ 安全提醒:**Agent-S 会直接在您的电脑上执行操作。请确保在安全可控的环境下运行,并时刻监控其行为,避免执行危险操作。 |
|---|
| |
❓ 常见问题
Q1: 安装时提示 pip 找不到包?
确保您使用的是 Python 3.8+ 版本,并且已激活正确的虚拟环境。可以使用 python --version 检查版本。
Q2: 运行时提示 API Key 未配置?
请检查环境变量是否正确设置。重启终端后环境变量才会生效。
Q3: Agent-S 操作速度很慢?
这可能是因为网络延迟导致 API 调用较慢,或任务过于复杂需要多步规划。可以尝试使用更快的模型。
Q4: 如何停止正在运行的任务?
按 Ctrl + C 可以中断当前任务。建议在任务执行期间保持监控,随时准备中断。
|---------------------------------------------------------------------|
| IT超新鲜 专注AI原理可视化科普,用动画讲清楚复杂技术! GitHub: github.com/simular-ai/Agent-S |