1. 什么是 Windows-MCP?
一句话总结:
Windows-MCP 是一个开源的 MCP 服务器,把大语言模型(LLM)和 Windows 桌面「打通」,让 AI 可以像人一样点击、输入、查文件、跑程序。
2. 核心能力
功能 | 一句话说明 | 典型场景 |
---|---|---|
文件浏览 | 列出/打开任意目录 | 让 AI 帮你找日志、整理桌面 |
应用控制 | 启动、关闭、切换窗口 | "打开 Excel 并新建表格" |
UI 自动化 | 鼠标、键盘、截图 | 自动填写表单、批量改图 |
QA 测试 | 读取 UI 状态并断言 | 让 AI 替你跑回归测试 |
零视觉依赖 | 不靠截图,纯系统 API | 速度更快、兼容高分屏 |
3. 真实体验数据
-
• 平均延迟:1.5--2.3 秒/次操作
-
• 系统占用:Python 单进程 < 50 MB 内存
-
• 首次配置:3 条命令,2 分钟完成(见下方教程)
4. 3 步上手(Windows 实测)
① 准备环境
go
# 安装 Python 3.13+
winget install Python.Python.3.13
# 或官网下载安装包
② 一键启动
go
git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
uv sync # 自动装依赖
uv run server # 启动 MCP 服务器
③ 接入 Cursor / Claude Desktop
在项目根目录新建 .cursor/mcp.json
:
go
{
"mcpServers":{
"windows":{
"command":"uv",
"args":["run","server"],
"cwd":"<你的Windows-MCP路径>"
}
}
}
重启 Cursor,看到 ✅ 即成功。
5. 与同类方案对比
方案 | 是否开源 | 依赖视觉 | 最低延迟 | 扩展难度 |
---|---|---|---|---|
Windows-MCP | ✅ | ❌ | 1.5 s | 改 Python 脚本即可 |
传统 RPA | ❌ | ✅ | 3--5 s | 需要商业 IDE |
纯浏览器插件 | ✅ | ✅ | 2--4 s | 仅限 Web |
6. 安全提示
-
• 默认只监听
127.0.0.1
,不外露端口 -
• 所有操作需用户显式授权(Cursor 会弹窗)
-
• 代码 MIT 协议,可自审、可二开
7. 下一步
-
• GitHub 地址:
github.com/CursorTouch/Windows-MCP
-
• 欢迎提 Issue、PR,或直接在 Discussion 分享你的自动化脚本!