Agent-S 安装使用教程:自动操作电脑的 AI

|---|
| |

|----------------------------------------------------------|
| 🤖 ## Agent-S 安装使用教程 首个超越人类的计算机操作 AI,让电脑自己干活 ⭐ 9.4K Star |

|---|
| |

🚀 项目介绍

Agent-S 是由 Simular AI 开发的开源框架,让 AI 能够像人类一样操作电脑。它可以:

|--------------------------------|
| ✅ 自动点击鼠标 - 识别屏幕元素并精准点击 |
| ✅ 自动敲键盘 - 输入文字、执行快捷键 |
| ✅ 自主思考决策 - 根据任务目标规划操作步骤 |
| ✅ 执行复杂任务 - 浏览网页、编辑文档、整理文件等 |

△ Agent-S 在 GitHub 上获得 9.4K Star

|---------------------------------------------------------------|
| **🏆 首个超越人类!**Agent-S 在 OSWorld 基准测试中达到 72.60% 的成功率,首次超越人类水平。 |

项目信息 详情
GitHub 地址 github.com/simular-ai/Agent-S
支持平台 Windows / macOS / Linux
开源协议 Apache 2.0
Star 数量 9.4K+

|---|
| |

📋 环境要求

在安装之前,请确保您的电脑满足以下条件:

要求 说明
操作系统 Windows 10+、macOS 10.15+、Ubuntu 20.04+
Python 3.8 或更高版本
Git 用于克隆代码仓库
API 密钥 OpenAI / Anthropic / Hugging Face(至少一个)

|-------------------------------------------------------------------|
| **⚠️ Linux 用户注意:**建议直接在系统环境下操作,避免使用 conda 环境,因为可能与 pyatspi 库产生冲突。 |

|---|
| |

⚙️ 安装步骤

|---|---------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | 克隆代码仓库 打开终端,执行以下命令: |---------------------------------------------------------------------| | git clone https://github.com/simular-ai/Agent-S.git cd Agent-S | |

|---|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 2 | 创建虚拟环境(推荐) 为了避免依赖冲突,建议创建独立的虚拟环境: |----------------------------------------------------------------------------------------------------------------------------------------| | # 创建虚拟环境 python -m venv venv # 激活虚拟环境(Windows) venv\Scripts\activate # 激活虚拟环境(macOS / Linux) source venv/bin/activate | |

|---|----------------------------------------------------------------------------|
| 3 | 安装依赖包 使用 pip 安装: |--------------------------| | pip install gui-agents | |

|---|
| |

🔑 配置 API 密钥

Agent-S 需要调用大语言模型 API 来实现智能决策。您需要至少配置以下一个 API 密钥:

服务商 推荐模型
OpenAI GPT-4o
Anthropic Claude 3.5 Sonnet
Hugging Face 开源模型

Windows 设置环境变量:

|---------------------------------------------------------------------------------------------------|
| $env:OPENAI_API_KEY="sk-your-api-key-here" $env:ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |

macOS / Linux 设置环境变量:

|-------------------------------------------------------------------------------------------------------|
| export OPENAI_API_KEY="sk-your-api-key-here" export ANTHROPIC_API_KEY="sk-ant-your-api-key-here" |

|---|
| |

💻 命令行使用

安装完成后,您可以通过 gui-agents 命令来启动 Agent-S:

基本用法:

|--------------------------------------------------|
| gui-agents --instruction "打开计算器,计算 123 乘以 456" |

任务示例:

任务类型 示例指令
应用操作 "打开记事本,写入 Hello World 并保存"
网页浏览 "打开浏览器,搜索 Python 教程"
文件管理 "创建一个名为 test 的文件夹"
复杂任务 "打开 Excel,创建包含姓名和年龄的表格"

|---------------------------------------------------------------------|
| **⚠️ 安全提醒:**Agent-S 会直接在您的电脑上执行操作。请确保在安全可控的环境下运行,并时刻监控其行为,避免执行危险操作。 |

|---|
| |

❓ 常见问题

Q1: 安装时提示 pip 找不到包?

确保您使用的是 Python 3.8+ 版本,并且已激活正确的虚拟环境。可以使用 python --version 检查版本。

Q2: 运行时提示 API Key 未配置?

请检查环境变量是否正确设置。重启终端后环境变量才会生效。

Q3: Agent-S 操作速度很慢?

这可能是因为网络延迟导致 API 调用较慢,或任务过于复杂需要多步规划。可以尝试使用更快的模型。

Q4: 如何停止正在运行的任务?

按 Ctrl + C 可以中断当前任务。建议在任务执行期间保持监控,随时准备中断。

|---------------------------------------------------------------------|
| IT超新鲜 专注AI原理可视化科普,用动画讲清楚复杂技术! GitHub: github.com/simular-ai/Agent-S |

相关推荐
金融RPA机器人丨实在智能3 分钟前
橡胶原料供应链转型:海外AI Agent适配国产进销存系统改造费用解析与实在Agent降本方案
人工智能·ai
AI服务老曹4 分钟前
源码交付与低代码布控:基于Docker与边缘计算的GB28181/RTSP视频AI管理平台架构二次开发实战
人工智能·低代码·docker
共创splendid--与您携手1 小时前
AI读取前端项目生成skill.md
前端·人工智能·ai
gis分享者2 小时前
AI数字营销实测体验,GEO效果查询功能体验
人工智能·csdn·geo·数字营销·实测体验·效果查询
莱歌数字2 小时前
轻出20%性能:三维拓扑优化如何重塑无人机电子设备散热格局
人工智能·科技·制造·cae·散热
猿小猴子3 小时前
主流 AI IDE 之一的「DeepSeek-Reasonix 」介绍
人工智能·ai·deepseek·reasonix
装不满的克莱因瓶3 小时前
链式法则如何传递参数误差 —— 深入理解神经网络中的梯度传播
人工智能·python·深度学习·神经网络·数学·机器学习·ai
Anastasiozzzz3 小时前
从有限状态机到智能体图:传统 FSM 与 Agent Graph的演进
java·人工智能·python·ai
程序员cxuan9 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan9 小时前
Claude Fable 5 来了
人工智能·后端·程序员