「OpenClaw」我写了个桌面控制Skill,让龙虾接管电脑!(MacOS版)

一、最近我做了一个新的 Skill:MacOS Desktop Control

  • 它的目标很简单:让 AI Agent 能够在 macOS 上更稳定、更可控地完成桌面操作,比如打开应用、识别屏幕内容、点击按钮、输入文字、拖拽元素,以及读取窗口状态。
  • 这个 skill 已经发布在 ClawHub 上clawhub.ai/kd-oauth/de...

二、为什么要写这个Skill

  • macOs兼容性:现有Skill都没有专门针对macOS做兼容性配置。比如很多MacBook是Retina屏,截图是像素坐标(pixels),但鼠标点击是逻辑坐标(point)。这里不做兼容的话,Agent就会"看得准,点不准"
  • 中文兼容性:现有Skill没有对中文输入和识别的兼容。比如我要打字"你好",其他Skill会无法正确输入,因为它们默认是键盘一个一个敲英文字母
  • macOs特性使用:现有Skill没有利用到macOS一些独有的特性。比如AppleScript很擅长打开app和读app标题,Apple自带的Apple Vision很适合读文字...等等

三、这个Skill能做什么?

这里我举两个简单的例子

1.点击侧边栏会话按钮

执行效果
  • OpenClaw识别到了会话栏,并且点击打开了会话
执行流程
  • 可以看到OpenClaw用Skill的能力完成了整个流程

2.新建备忘录并输入"我是KD"

执行效果
  • 直接打开并新建&输入,执行的很快,因为完全是本地操作
执行流程
  • Applescript负责切备忘录到前台,keyboard负责快捷键和文件输入

四、目录结构

markdown 复制代码
desktop-control-for-macos/
├── SKILL.md
├── _meta.json
├── requirements.txt
├── .DS_Store
└── scripts/
    ├── applescript_app.py
    ├── applescript_window.py
    ├── calibration.py
    ├── capture_screen.py
    ├── crop_image.py
    ├── init_coordinate_mapping.py
    ├── keyboard.py
    ├── locate_image_opencv.py
    ├── locate_text_ocr.py
    └── mouse.py

五、一个清晰的操作流水线

flowchart TD A[用 AppleScript 激活 App
或读取窗口状态] B[初始化坐标映射] C[截取屏幕] D[用 OCR 或 OpenCV 找到目标] E[用鼠标或键盘执行动作] F[结束 / 验证结果] A --> B --> C --> D --> E --> F

六、写在最后

欢迎大家下载使用!有意见或建议可以留言,我会持续完善这个Skill

相关推荐
devpotato2 分钟前
人工智能(十六)- SSE 流式:让 Agent 像 ChatGPT 一样“边想边说“
人工智能·语言模型·langchain
深度智能Ai4 分钟前
云声配音(MelodyCloud Studio):AI驱动的全链路音视频创作平台
人工智能·音视频
irpywp8 分钟前
合盖断网打断后台计算,Modafinil:一款防休眠菜单栏工具,让 Mac 闭眼继续跑 Agent
macos·ios·开源·github
边缘计算社区11 分钟前
物理 AI 为什么离不开边缘计算?
人工智能·边缘计算
扬帆破浪26 分钟前
免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:sidecar起不来怎么排查 62581端口被占的几种现实情况
开源
宝贝儿好30 分钟前
【LLM】第三章:项目实操案例:智能输入法项目
人工智能·python·深度学习·算法·机器人
AI创界者43 分钟前
【首发】LTX-2.3-10Eros 视频生成本地化部署教程:8G显存流畅运行,支持RTX 50系列(附一键整合包)
人工智能
Elastic 中国社区官方博客1 小时前
Elastic 的 AI agent skills
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
容智信息1 小时前
AI Agent(智能体)的输出格式应该从 Markdown 转向 HTML吗?
前端·人工智能·rust·编辑器·html·prompt
学习论之费曼学习法1 小时前
AI 入门 30 天挑战 - Day 28 - 前沿技术概览
人工智能