用自然语言控制你的电脑:Windows-MCP 项目实测

1. 什么是 Windows-MCP?

一句话总结:

Windows-MCP 是一个开源的 MCP 服务器,把大语言模型(LLM)和 Windows 桌面「打通」,让 AI 可以像人一样点击、输入、查文件、跑程序。

2. 核心能力

功能 一句话说明 典型场景
文件浏览 列出/打开任意目录 让 AI 帮你找日志、整理桌面
应用控制 启动、关闭、切换窗口 "打开 Excel 并新建表格"
UI 自动化 鼠标、键盘、截图 自动填写表单、批量改图
QA 测试 读取 UI 状态并断言 让 AI 替你跑回归测试
零视觉依赖 不靠截图,纯系统 API 速度更快、兼容高分屏

3. 真实体验数据

  • • 平均延迟:1.5--2.3 秒/次操作

  • • 系统占用:Python 单进程 < 50 MB 内存

  • • 首次配置:3 条命令,2 分钟完成(见下方教程)

4. 3 步上手(Windows 实测)

① 准备环境

go 复制代码
# 安装 Python 3.13+
winget install Python.Python.3.13
# 或官网下载安装包

② 一键启动

go 复制代码
git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
uv sync          # 自动装依赖
uv run server    # 启动 MCP 服务器

③ 接入 Cursor / Claude Desktop

在项目根目录新建 .cursor/mcp.json

go 复制代码
{
  "mcpServers":{
    "windows":{
      "command":"uv",
      "args":["run","server"],
      "cwd":"<你的Windows-MCP路径>"
    }
}
}

重启 Cursor,看到 ✅ 即成功。

5. 与同类方案对比

方案 是否开源 依赖视觉 最低延迟 扩展难度
Windows-MCP 1.5 s 改 Python 脚本即可
传统 RPA 3--5 s 需要商业 IDE
纯浏览器插件 2--4 s 仅限 Web

6. 安全提示

  • • 默认只监听 127.0.0.1,不外露端口

  • • 所有操作需用户显式授权(Cursor 会弹窗)

  • • 代码 MIT 协议,可自审、可二开

7. 下一步

  • • GitHub 地址:github.com/CursorTouch/Windows-MCP

  • • 欢迎提 Issue、PR,或直接在 Discussion 分享你的自动化脚本!

相关推荐
私人珍藏库6 小时前
[吾爱大神原创] 任务栏透明度设置小工具
windows·工具
charlie11451419110 小时前
Windows 10系统编程——进程专题:枚举我们进程的状态
c++·windows·学习·操作系统·进程
CHANG_THE_WORLD11 小时前
Windows程序字符串处理与逆向分析
windows·stm32·单片机
竹等寒13 小时前
Powershell 管理 后台/计划 作业(六)
服务器·windows·网络安全·powershell
非凡ghost13 小时前
极简时钟APP(手机全能计时工具) 极简版
windows·智能手机·软件需求
角砾岩队长15 小时前
Windows系统下的Git安装(2025年6月更新)
windows·git
卓码软件测评1 天前
第三方软件验收测试:【AutoIt与Selenium结合测试文件上传/下载等Windows对话框】
windows·功能测试·selenium·测试工具·性能优化·可用性测试
ajassi20001 天前
开源 C# 快速开发(十六)数据库--sqlserver增删改查
windows·开源·c#
sukalot1 天前
windows显示驱动开发-IddCx 1.10 及更高版本的更新
windows·驱动开发
一只学java的小汉堡1 天前
RabbitMQ 在 Windows 环境下启动失败的完整解决方案
windows·分布式·rabbitmq