OpenClaw (你提到的"open claw")确实可以做到像素级鼠标控制 ,它是目前最流行的开源自托管AI智能体之一,但架构与Claude Computer Use或OpenManus有本质不同。
OpenClaw 核心定位(2026年现状)
OpenClaw(GitHub: openclaw/openclaw)是一个自托管的AI助手网关 ,不是单一模型,而是多通道接入+技能插件架构:
用户(WhatsApp/Telegram/Discord/iMessage)
↓
OpenClaw Gateway(WebSocket控制平面)
↓
Skills(插件系统)
├─ Desktop Control(鼠标键盘控制)← 你问的
├─ Browser(浏览器自动化)
├─ Terminal(终端命令)
└─ 700+ ClawHub技能(GitHub/Gitlab/Spotify等)
关键区别:
- Claude Computer Use:云端模型直接控制你的电脑(需API)
- OpenManus:Python脚本本地运行(需安装依赖)
- OpenClaw :始终在线的守护进程 ,通过聊天消息(发微信/钉钉/Telegram)控制你的电脑
鼠标控制能力:Desktop Control Skill
OpenClaw通过Desktop Control Skill 实现全桌面操控(非仅浏览器):
能力范围(来自官方文档):
- Pixel-perfect mouse control:精确鼠标移动、点击、拖拽
- Lightning-fast keyboard input:键盘输入、快捷键组合
- Screen capture:实时截屏供AI分析
- Cross-application:可跨应用操作(如从Excel复制数据到浏览器)
技术实现:
- 底层使用 PyAutoGUI 或 Pynput(Python自动化库)
- 通过 Canvas 组件推送UI界面到手机(类似远程桌面)
- 支持 A2UI(AI-to-User-Interface)协议
触发方式:
bash
# 通过命令行(本地)
openclaw agent --message "打开Photoshop,创建1920x1080画布,画一个红色圆形"
# 或直接在WhatsApp/Telegram发消息给OpenClaw Bot:
"帮我把桌面上的report.pdf拖到微信文件传输助手"
与之前方案的对比(2026年4月)
| 特性 | OpenClaw | Claude 4.5 Computer Use | OpenManus |
|---|---|---|---|
| 鼠标控制 | ✅ Desktop Control Skill | ✅ 原生像素级控制 | ✅ 基于Playwright/Browser-use |
| 操控范围 | 全桌面+浏览器 | 全桌面 | 主要浏览器,桌面需额外工具 |
| 接入方式 | WhatsApp/Telegram/Discord等12+消息平台 | API/开发者工具 | 本地Python脚本 |
| 自托管 | ✅ 完全本地(Gateway运行在本地) | ❌ 云端模型 | ✅ 本地 |
| 开源 | ✅ MIT License(43万行代码) | ❌ 闭源API | ✅ 开源 |
| 社区技能 | 700+ Skills (ClawHub) | 无 | 较少 |
重要安全警告(2026年3月)
OpenClaw在2026年3月遭遇了**"ClawHavoc"**供应链攻击:
- 341个恶意Skills被上传到ClawHub
- 通过提示词注入(Prompt Injection)控制用户电脑(鼠标移动、文件窃取)
- 超过9,000个安装实例受影响
安全措施(当前版本强制要求):
- Sandbox模式:必须在Docker/Podman中运行Desktop Control Skill
- Approval Gates:鼠标点击、文件删除等高风险操作需人工确认
- Clawguard :第三方安全扫描工具(
jiangmuran/clawguard),扫描Skills的恶意代码
资料与安装
GitHub仓库:
- 核心代码:
github.com/openclaw/openclaw(23个相关仓库) - 快速安装:
npm install -g openclaw@latest && openclaw onboard
Desktop Control Skill文档:
- LLMBase技术文档(详细API):
llmbase.ai/openclaw/desktop-control/ - 该Skill需单独安装:
clawhub install desktop-control
架构论文/分析:
- OpenClaw-RL项目(强化学习版本):使用Qwen3VL +PyAutoGUI进行GUI控制,支持VM环境训练
结论
OpenClaw的Desktop Control Skill 确实具备完整鼠标控制能力 (移动、点击、拖拽、滚轮),且支持手机远程控制(通过WhatsApp发指令控制家里电脑)。
但风险极高 ------它是一个始终在线的守护进程 ,如果被恶意Skills利用,攻击者可以直接控制你的鼠标和键盘。2026年3月的ClawHavoc事件后,社区强制要求沙箱隔离+人工确认机制。
你是想部署来用,还是研究其Desktop Control的技术实现(PyAutoGUI封装)?