大家好,我是子昕,一个干了10年的后端开发,现在在AI编程这条路上边冲边摸索,每天都被新技术追着跑。
今天给大家安利一个使用Cursor就能自动操作Chrome浏览器的MCP神器!
啥玩意儿这么神?
这是一个开源的MCP工具------Chrome MCP Server,基于Chrome插件的模型上下文协议(MCP)服务器,能把你的浏览器功能直接暴露给Cursor这样的AI助手,实现复杂的浏览器自动化、内容分析和语义搜索等。
其实就是让AI直接控制你的浏览器干活。
跟传统的 Playwright 那种自动化工具不一样,这货直接用你正在用的 Chrome,保留你所有的登录状态、书签、历史记录啥的。
能干啥?功能多到离谱
不吹不黑,这东西的功能清单看得我眼花:
📊 浏览器管理类
- 列出所有窗口和标签页
- 导航到指定网址(支持新窗口)
- 关闭指定标签页
- 前进后退历史导航
📸 截图和视觉工具
- 高级截图功能,支持元素截图、全页截图
- 直接输出 Base64 格式
🌐 网络监控
- 捕获网络请求(webRequest API)
- Chrome 调试器 API 捕获(包含响应体)
- 发送自定义 HTTP 请求
🔍 内容分析(这个最牛)
- 跨标签页的 AI 语义搜索
- 提取网页 HTML 或文本内容
- 查找页面可交互元素
🎯 交互操作
- CSS 选择器点击元素
- 填充表单字段
- 模拟键盘输入和快捷键
📚 数据管理
- 搜索浏览器历史记录
- 书签搜索、添加、删除
真的,这功能列表我看了三遍,属于是把我平时手动操作的所有东西都覆盖了。
3分钟搞定安装
讲真,我一开始以为又是那种折腾半天装不好的玩意儿,结果意外地顺滑。
第一步:下载扩展
直接去 GitHub Releases 页面下载最新版:

下载完解压到你记得住的地方。然后:
- Chrome 地址栏输入 chrome://extensions/
- 右上角开启"开发者模式"
- 点"加载已解压的扩展程序",选择刚才解压的文件夹
biu~扩展就装好了,页面会显示一个简洁的控制面板。

第二步:安装"网桥"
这里需要一个桥接程序让 AI 和浏览器插件"握手"。命令行敲一下:
npm install -g mcp-chrome-bridge
用 pnpm 的话:
pnpm install -g mcp-chrome-bridge

嗯,就这样,没了。
第三步:连接服务
启动桥接服务(扩展界面会有提示):

然后把这段配置加到你的 MCP 客户端(比如 Cursor):

看到绿色的连接状态?恭喜,你成功了!

我当时装完第一反应是:就这?这么简单?然后立马开始各种测试...
实战体验
装好之后我就开始疯狂测试,每个功能都要试一遍。
截图功能
我说"帮我截个某某网站的图",AI 直接:
- 自动打开网站(如果没有的话)
- 等页面加载完
- 自动截图

整个过程行云流水,我连鼠标都没碰。而且还能指定截某个元素,比如"只截导航栏"、"截整个页面"啥的。
网页内容总结

历史记录搜索
Chrome 自带的历史记录搜索你懂的,经常找不到想要的。但这个可以用自然语言描述,比如"搜索近10天关于腾讯混元大模型向量化的记录",它真的能找到!

书签搜索
我的书签一直是个灾难现场,各种乱七八糟的链接堆在一起,我也一直懒得整理,导致经常找不到。
但这个可以帮我精确寻找书签,甚至还能帮我自动整理归类。

自动化操作
最让我震惊的是表单填充和键盘操作。我说"搜索框输入'DeepSeek'然后按回车",它就真的去做了。

找到搜索框,输入文字:

模拟按键:

试用之后,发现一些值得分享的点:
- 隐私很安全: 完全本地运行,数据不会上传到任何地方。这点对我这种隐私强迫症很重要。
- 跨标签页很智能: 可以同时操作多个标签页,比如"关闭所有关于某某的页面",一次性清理。
- 错误处理很人性化: 偶尔遇到页面加载慢或者元素找不到的情况,它会等待或者给出清晰的提示,不会直接报错。
- 学习成本几乎为零: 不需要学什么特殊语法,就用自然语言描述你想要的操作就行。
当然,现在还不够完美。项目还在快速迭代中,作者计划加入更多功能比如录制回放、工作流自动化等。但即使是现在这个版本,已经足够让我日常使用了。
项目信息
- GitHub: github.com/hangwin/mcp...
- 文档: 项目 README 和 docs 文件夹有详细说明
- 问题反馈: GitHub Issues