一、测试,终于开始被 AI 接管了
- 这几年大家都在卷 AI 写代码,写得确实快。但写完之后呢?我们还是得乖乖当个"点读机",自己拿个手机/浏览器点点点,找 Bug。代码生成的速度,硬生生被人工测试的龟速给拖垮了。
- 今天,我们正式把 Munk AI 开源了。这是一个有眼睛、有手、还能基于执行结果持续复盘的 AI 测试引擎。
二、给 Coding Agent 装上"眼和手",真正实现自动化闭环
- 你负责写,Munk 负责测,发现问题就把证据回传给 Agent 继续修。
- 现在的 Cursor/Claude 就像个"瞎子"。它写完代码,你得自己跑起来看界面对不对。报错了,你还得截图、复制报错栈,再喂给它。这叫什么自动化?这叫"人肉搬运工"。
- Munk AI 原生暴露了标准的 MCP 接口。
- 你的 Coding Agent 写完代码后,可以直接"使唤" Munk AI 去操作真实的真机或浏览器。
- Munk AI 会像真人一样去点击、输入、验证。一旦发现不对劲,它会把现场截图 + 完整的 UI 树 + 错误堆栈打包回传给 Coding Agent,让后续修复真正建立在执行证据上。
- 人类,从此退出测试群聊。

注:Coding Agent 写业务,Munk AI 控制设备跑测试
三、企业级测试:一套"活"的用例,跑通所有兼容性
- 无视 UI 重构,天生跨平台,测试资产越用越聪明。
- 做过企业级回归测试的都知道,写自动化脚本就是个"填坑"的过程。今天前端改个
div,明天改个id,甚至只是换个机型,你的 XPath 脚本就直接罢工,维护成本比重写还高。 - 泛化能力(跨端/跨机型):Munk AI 的核心不是依赖脆弱的选择器,而是基于视觉理解、结构化信息和真实执行证据来做判断。你只要给一句自然语言:"点击右上角的头像",不管是大屏小屏、Android 还是 Web,它都更有机会自己"看"懂并完成动作。UI 改版之后,用例也不用每次都从头重写。
- 自我进化(经验沉淀):遇到网络卡顿?突然跳出个广告弹窗?Munk AI 不会像传统脚本那样一碰就碎。它会识别问题、重试或调整策略。更重要的是,它会把这次"踩坑"过程里的执行证据沉淀成候选知识和优化建议,让下一次跑得更准。
- 别再写那些脆弱的自动化脚本了。Munk AI 的用例,是活的,是会自己进化的。

注:Munk Agent维护的业务知识库
四、开箱即用,拒绝折腾
- 本地优先,隐私无忧:很多大厂不敢用云端 AI 跑测试,怕数据泄露。Munk AI 所有测试资产都在你本地,极其安全。
- Apache-2.0 开源许可,企业和个人都能放心用:不管你是想在公司内部落地,还是自己拿来折腾、二次开发、接进工作流,都不用在许可证上束手束脚。
- 超高颜值的 Web 控制台:我们不仅开源了底层引擎,还自带了一个极其好用的 Local Web UI。不懂命令行的 QA 小姐姐,也能点点鼠标,一键下发成百上千个测试用例。

注:Web UI 界面
五、点个 Star,和我们一起干翻"古法测试"
- 当 AI 能够真正承担起测试与验证这件事,软件工程的效率才会迎来真正的质变。
- 如果你也相信 AI 会重新定义"测试",欢迎一起来修 Bug、加功能、提想法,把这套东西一起做出来。
- 🌟 求 Star,求围观 :github.com/chaxiu/munk...
- 📖 了解更多 / 安装体验 :munk.sh
- 💬 进群吹水,一起搞事情:关注公众号「朱涛的自习室」,获取进群方式