本地端侧GUI智能体Mano-P:macOS版本安装与使用全指南
在AI Agent快速发展的当下,**端侧运行、数据安全、纯视觉交互**的GUI自动化能力,成为企业与个人用户的核心诉求。Mano-P作为面向端侧设备的GUI感知智能体模型,凭借本地推理、跨平台适配、长任务自主执行等优势,重新定义桌面操作自动化的实现方式。本文将聚焦macOS版本(首选稳定平台),详细讲解Mano-P的安装步骤与完整使用方法,帮助大家快速上手,实现用自然语言操控电脑的便捷体验。
一、Mano-P项目核心定位
Mano-P是开源**GUI-VLA(视觉-语言-动作)智能体**,聚焦边缘设备本地运行,以纯视觉理解实现跨系统GUI自动化操作,无需依赖API接口,可自主完成点击、输入、拖拽等各类桌面操作。
项目名称中,Mano为西班牙语"手",P代表Person(个体)与Party(组织),核心愿景是让个人与组织都能拥有专属个性化AI,实现人机协同。该项目分三阶段开源:先开放Mano-CUA技能降低Agent开发门槛,再推出本地模型与SDK满足高安全需求,最后公开训练、剪枝与量化技术,支持开发者定制专属GUI-VLA模型。
项目地址:https://github.com/Mininglamp-AI/Mano-P/blob/main/README_CN.md
二、核心能力与技术优势(macOS专属精简版)
Mano-P在macOS平台(尤其Apple M4芯片设备)适配最稳定,核心亮点如下,帮助大家快速了解其适用场景:
-
本地运行:支持苹果M4芯片+32GB及以上内存的Mac mini/MacBook直接本地推理,数据全程不出设备,隐私安全拉满;无M4芯片可搭配Mano-P算力棒(通过USB 4.0及以上端口连接)即插即用。
-
性能领先:OSWorld专用GUI智能体测试中,Mano-P 1.0-72B以58.2%成功率位居第一,WebRetriever Protocol I测试超越Gemini、Claude同类能力,在macOS上运行更流畅。
-
全场景适配:完美支持macOS全版本(推荐 Ventura及以上),可实现点击、输入、拖拽、热键、应用启动、URL跳转等全方位GUI操作,覆盖办公、娱乐等各类场景。
-
易用性强:支持CLI命令行、Claude Code集成两种使用方式,无需复杂配置,自然语言即可下达指令,适配macOS终端、Claude Code等常用工具。
三、Mano-P运行原理(macOS本地模式为主,含两种推理模式)
Mano-P的核心原理是基于"视觉-语言-动作"(GUI-VLA)的闭环协同,结合端侧优化技术,实现无需API、纯视觉驱动的桌面自动化。其在macOS上支持本地模式和云端模式两种推理模式,系统会自动检测本地模型配置,无缝切换,两种模式的运行流程及细节如下,贴合macOS运行特性,通俗易懂:
3.1 本地模式(推荐,高隐私安全)
本地模式是Mano-P在macOS上的首选运行模式,适用于有高安全需求、处理敏感数据的场景,所有数据处理均在本地完成,具体流程如下:
-
截取当前屏幕截图:模型通过macOS的屏幕录制权限,实时捕获当前桌面完整截图,获取GUI界面的所有元素信息;
-
本地模型推理:在本地设备(M4芯片+32GB及以上内存的Mac mini/MacBook)或连接的Mano-P算力棒上,运行Mano-P本地模型进行推理,无需依赖任何云端服务;
-
生成操作指令:本地模型解析用户自然语言指令,结合捕获的屏幕截图,分析GUI元素(按钮、输入框等),返回下一步具体操作指令(如点击、输入等);
-
本地执行操作:客户端通过辅助功能权限调用macOS系统接口,执行模型返回的操作指令;
-
循环完成任务:重复"截图-推理-执行"的流程,直至完成用户下达的全部任务。
数据隐私说明:本地模式下,所有数据处理均在本地设备完成,截图、任务描述等信息全程不出设备,无需担心数据泄露;同时项目完整源代码开源可审计,进一步保障使用安全,适合处理敏感信息和高安全要求的场景。
3.2 云端模式(默认,无本地硬件限制)
当设备未满足本地运行硬件要求(无M4芯片、内存不足32GB且未连接算力棒)时,系统会默认切换至云端模式,具体流程如下:
-
截取当前屏幕截图:与本地模式一致,通过屏幕录制权限捕获当前桌面截图;
-
上传数据至云端:将捕获的屏幕截图和用户的自然语言任务描述,发送至云端视觉模型(服务器地址:mano.mininglamp.com);
-
云端模型推理:云端模型分析截图和任务描述,生成对应的桌面操作指令,反馈至本地客户端;
-
本地执行操作:本地客户端接收云端指令后,调用macOS系统接口执行操作(点击、输入等);
-
循环完成任务:重复"截图-上传-推理-执行"的流程,直至任务完成。
注意事项:云端模式会发送屏幕截图和任务描述至云端服务器,但不会访问或传输本地文件、剪贴板内容、系统凭证等敏感信息;为保障隐私安全,运行任务时请避免在屏幕上显示敏感文档、聊天记录或凭证信息。
3.3 核心协同与端侧优化
无论哪种推理模式,Mano-P均遵循"思考-行动-验证"的闭环协同机制:若某一步操作未达到预期(如未找到目标联系人、应用未启动),模型会自主调整操作步骤(如重新搜索应用、检查窗口是否最小化),直至完成整个任务。
此外,Mano-P针对macOS进行了专项优化:采用混合精度量化、视觉Token剪枝(GS-Pruning算法)等技术,让大参数量模型能在M4芯片设备上高效运行(如4B量化模型在M4 Pro上可实现476 tokens/s预填充),同时通过独立虚拟环境隔离,避免污染系统Python,保障运行稳定性。
四、macOS版本详细安装步骤(重点实操,全程可落地)
Mano-P在macOS上通过mano-cua工具实现桌面自动化,支持Homebrew一键安装,无需手动配置依赖,步骤清晰,以下从前置准备、安装操作、权限配置、安装验证四个环节详细讲解,确保新手也能顺利完成。
4.1 前置准备(macOS专属)
-
设备要求:优先推荐配备「Apple M4芯片+32GB及以上内存」的Mac mini或MacBook(运行最流畅);无M4芯片的Mac设备,需搭配Mano-P算力棒(通过USB 4.0及以上端口连接),即可正常部署使用。
-
系统要求:推荐macOS Ventura(13.0)及以上版本,确保系统兼容性,避免出现权限异常、依赖缺失等问题。
-
权限准备:需提前准备「屏幕录制权限」「辅助功能权限」,这是Mano-P实现截图、鼠标/键盘控制的核心,后续会详细说明配置方法,缺一不可。
-
网络准备:安装过程需联网(用于下载Homebrew及mano-cua相关依赖包);安装完成后,切换至本地模式可完全离线使用,无需联网。
4.2 具体安装操作(一键部署,新手友好)
macOS系统可通过Homebrew一键安装mano-cua工具,自动配置虚拟环境和依赖,无需手动操作,具体步骤如下:
-
安装Homebrew(已安装可直接跳过):
打开macOS自带「终端」(可通过聚焦搜索:按下Command+空格,输入"终端"打开),输入以下命令,按提示完成Homebrew安装(过程约5-10分钟,取决于网络速度,期间可能需要输入电脑开机密码):
/bin/bash \-c \&\#34;$\(curl \-fsSL https://raw\.githubusercontent\.com/Homebrew/install/HEAD/install\.sh\)\&\#34;安装注意事项:若提示"xcode-select: error: command line tools are required",需先安装Xcode命令行工具,按照终端提示输入"xcode-select --install",点击安装即可,安装完成后重新执行上述Homebrew安装命令。
-
安装mano-cua工具(核心步骤):
Homebrew安装完成后,无需重启终端,直接输入以下命令,一键安装mano-cua(系统会自动创建独立Python 3.13虚拟环境,不污染系统自带Python,同时自动安装Tkinter等所需依赖):
brew install HanningWang/tap/mano\-cua安装成功提示:终端会显示"Successfully installed mano-cua",此时可输入验证命令,确认安装成功。
-
安装验证(关键一步,确认可正常使用):
终端输入以下命令,若出现mano-cua的帮助信息(包含run、stop等命令说明),即为安装成功;若提示"command not found",需重启终端后再次尝试。
mano\-cua \-h
4.3 权限配置(核心关键,缺一不可)
Mano-P需要屏幕录制权限(用于识别桌面界面)和辅助功能权限(用于控制鼠标、键盘),未配置权限会导致无法执行任何GUI操作,具体配置步骤如下(macOS通用):
-
打开系统设置:点击屏幕左上角「苹果图标」→「系统设置」( Ventura及以上版本);若为旧版本(Monterey及以下),点击「系统偏好设置」。
-
配置屏幕录制权限:
在系统设置中,找到「隐私与安全」→ 点击左侧「屏幕录制」→ 点击右侧「+」号,选择「终端」(若使用iTerm2等其他终端工具,需同时勾选该工具),勾选后会提示"终端将可以录制屏幕",点击「确定」。
-
配置辅助功能权限:
在「隐私与安全」左侧,找到「辅助功能」→ 同样点击右侧「+」号,选择「终端」(或所用终端工具),勾选后完成配置。
-
生效权限:权限配置完成后,必须重启终端(关闭当前终端窗口,重新打开),否则权限无法生效,后续操作会提示权限不足。
权限配置注意事项:若勾选终端后,仍提示权限不足,可先取消勾选,关闭系统设置,重新打开后再次勾选,重启终端即可解决;若系统提示"无法修改权限",需先解锁「隐私与安全」窗口左下角的锁(输入电脑开机密码),再进行操作。
五、macOS版本使用方法(两种方式,按需选择)
Mano-P在macOS上支持两种使用方式,均无需复杂配置,输入自然语言即可下达指令,覆盖不同使用场景,详细操作如下:
5.1 CLI命令行使用(推荐,快速便捷)
适合开发者、高级用户,可在终端直接输入命令,快速执行GUI自动化任务,常用命令及示例如下:
- 基础命令(必记):
`# 运行自动化任务(核心命令)
mano-cua run "自然语言指令"
停止当前正在执行的任务
mano-cua stop
查看帮助信息(忘记命令时使用)
mano-cua -h`
-
常用场景示例(直接复制即可使用):
-
办公场景:
mano\-cua run \&\#34;打开微信,找到联系人FTY,发送消息'会议延期到明天'\&\#34; -
浏览场景:
mano\-cua run \&\#34;打开Safari浏览器,搜索'Mano\-P最新版本',展示第一条搜索结果\&\#34; -
文件操作:
mano\-cua run \&\#34;打开访达,进入文稿文件夹,创建一个名为'Mano\-P测试'的文件夹\&\#34; -
娱乐场景:
mano\-cua run \&\#34;打开音乐APP,搜索'晴天',播放该歌曲\&\#34; -
使用注意事项:
- 指令描述需清晰、具体,避免模糊表述(如"打开浏览器"需明确"打开Safari"或"打开Chrome");2. 任务执行过程中,请勿手动操作鼠标、键盘,避免干扰Mano-P的自动化操作;3. 若任务执行失败,可检查指令表述是否清晰,或权限是否配置到位,重启终端后重新尝试。
5.2 Claude Code集成使用(适配AI Agent,自主执行)
适合使用Claude Code的用户,将mano-cua技能集成后,无需手动输入终端命令,直接向Claude Code下达自然语言需求,Agent会自动调用mano-cua完成GUI操作,步骤如下:
-
前置准备:确保已安装Claude Code(可在官网下载),且已完成上述mano-cua的安装与权限配置。
-
安装mano-cua技能包:
- 访问ClawHub官网(或通过Mano-P项目地址跳转),搜索"mano-cua",下载最新版本的skill zip压缩包;2. 解压压缩包,将解压后的文件夹复制到Claude Code的commands目录(路径:~/Library/Application Support/Claude Code/commands,若没有commands文件夹,手动创建即可)。
-
启用技能:重启Claude Code,进入会话界面,技能会自动加载,无需额外配置。
-
使用示例:
向Claude Code输入需求:"帮我打开Excel,创建一个表格,包含姓名、年龄、联系方式三列,填入3条测试数据",Claude Code会自动调用mano-cua技能,全程自主完成操作,无需人工干预。
六、macOS版本常见问题与解决方法
-
问题1:终端输入"mano-cua -h"提示"command not found"?
解决方法:1. 重启终端后再次尝试;2. 若仍失败,重新执行Homebrew安装命令,确保安装过程无报错;3. 检查Homebrew是否已添加到系统环境变量,可输入"brew -v"验证,若提示brew未找到,需重新配置环境变量。
-
问题2:执行任务时提示"权限不足,无法录制屏幕"?
解决方法:重新检查"屏幕录制"和"辅助功能"权限,确保已勾选终端,重启终端后再次执行任务;若仍失败,重启电脑后重新配置权限。
-
问题3:Mano-P无法识别桌面应用或操作失败?
解决方法:1. 确保应用已安装且可正常打开;2. 指令描述需具体,避免模糊;3. 检查设备是否满足硬件要求(M4芯片+32GB内存),无M4芯片需连接算力棒;4. 尝试更新mano-cua到最新版本,终端输入"brew update mano-cua"。
-
问题4:本地模式无法使用,提示"需连接云端"?
解决方法:确保设备已满足本地运行要求(M4芯片+32GB内存或连接算力棒),安装完成后默认优先使用本地模式,若仍提示云端连接,重启终端即可切换。
七、总结
Mano-P在macOS平台的适配最稳定、体验最佳,凭借本地推理、高安全性、易用性强的优势,无需复杂配置,即可通过自然语言实现桌面操作自动化,覆盖办公、娱乐等各类场景。其核心原理围绕"视觉-语言-动作"闭环协同,支持本地和云端两种推理模式,兼顾隐私安全与使用灵活性,结合端侧优化技术,既保证了运行效率,又兼顾了数据隐私安全。按照本文的安装步骤,新手也能快速完成部署,轻松实现人机协同,提升操作效率。
后续Mano-P将持续优化macOS版本的兼容性,推出更多适配macOS的专属功能,建议定期通过"brew update mano-cua"更新工具,获取最新特性与修复。
(注:文档部分内容可能由 AI 生成)