nanobot安装部署-并接入agent-browser实现浏览器自动化操作
关于 nanobot
nanobot 是由香港大学数据科学学院(HKUDS)开源的一款轻量级、可扩展的 AI 智能体框架,核心定位是让开发者能够快速构建、部署和运行具备工具调用能力的 AI Agent。它的设计理念是低代码 / 无代码化实现 AI 驱动的自动化任务,支持对接主流大模型(如 Claude、OpenAI、DeepSeek 等),并通过插件化的 skills 体系扩展智能体能力,尤其擅长将自然语言指令转化为可执行的自动化操作,是 AI 原生自动化领域的高效工具。(轻量版openclaw)
关于 agent-browser
agent-browser 是 Vercel Labs 推出的专为 AI Agent 设计的浏览器自动化工具,基于 Playwright 内核深度优化,但针对 AI 交互场景做了大量适配。它的核心优势是自然语言友好性 和操作鲁棒性------ 相比传统的浏览器自动化工具,agent-browser 能直接理解 AI 生成的自然语言指令,无需开发者手动编写定位元素、模拟点击等底层代码,同时内置了更智能的页面加载等待、元素定位容错机制,大幅降低 AI 驱动浏览器自动化的落地门槛。
为什么选择 agent-browser 而非 playwright-mcp
nanobot 的默认浏览器自动化依赖 playwright-mcp(openclaw 默认组件),但在实际使用中,agent-browser 展现出更优的适配性:
- AI 指令理解更精准:playwright-mcp 需要严格的结构化指令(如指定 selector、操作类型),而 agent-browser 可直接解析自然语言(如 "点击页面右上角的登录按钮"),无需人工转换指令格式;
- 容错性更强:面对动态加载页面、元素位置变化等场景,agent-browser 内置了智能重试和元素模糊匹配机制,而 playwright-mcp 易因元素定位失败导致任务中断;
- 部署更轻量化:agent-browser 提供全局 npm 安装方式,自动集成 Chromium 浏览器和依赖,无需手动配置 Playwright 环境;
- 与 nanobot 的 skills 体系无缝兼容:agent-browser 官方提供了适配 nanobot 的 skills 插件,直接复制即可接入,无需二次开发适配。
安装nanobot
项目参考:https://github.com/HKUDS/nanobot
提供的安装方式:
python
# Install from source (latest features, recommended for development)
git clone https://github.com/HKUDS/nanobot.git
cd nanobot
pip install -e .
# Install with uv (stable, fast)
uv tool install nanobot-ai
# Install from PyPI (stable)
pip install nanobot-ai
如果你想直接用官方能力,不需要调试代码或者二次开发可以直接使用uv或者pip的方式进行安装。这里演示使用pip进行安装:
python
# 创建一个虚拟环境
conda create --name nanobot python=3.12
conda activate nanobot
pip install nanobot-ai -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/
使用
初始化配置
python
# 1. 先初始化
nanobot onboard # 一般会生成 C:\Users\Administrator\.nanobot 这个目录
# 初始化过程会让你输入一些配置比如模型配置,可以直接输入。也可以后续手动在config.json配置。
# 2. 在.nanobot目录下配置config.json文件 配置模型
## 配置模型名称、模型apikey 根据你使用的模型厂商进行选择。
"agents": {
"defaults": {
"workspace": "~/.nanobot/workspace",
"model": "claude-4.5-sonnet", # 配置模型名称
"maxTokens": 12000,
"temperature": 0.1,
"maxToolIterations": 40,
"memoryWindow": 100
}
},
"providers": {
"custom": {
"apiKey": "",
"apiBase": null,
"extraHeaders": null
},
"anthropic": {
"apiKey": "",
"apiBase": null,
"extraHeaders": null
},
"openai": {
"apiKey": "",
"apiBase": null,
"extraHeaders": null
},
"openrouter": {
"apiKey": "ailab_SuX2usnfxFWQCisJoje5g6aa4ICIXOMlBRedkxS2b8TCMGWpVYBtu7eiovL+UgZejykWCOPDeurZixjlOGU2GhUGU=",
"apiBase": "https://*****/v1/chat/completions",
"extraHeaders": null
},
"deepseek": {
"apiKey": "",
"apiBase": null,
"extraHeaders": null
},
常见配置
nanobot的memory和skills存储在下面的目录:如果你要扩展其他地方的skills,直接放到下面的skills目录下。后面会放入agent-browser的skills,用于操作浏览器自动化。

对话
nanobot agent # 开启智能对话

安装agent-browser
安装
-
首先安装npm(自行百度或者豆包)
-
安装agent-browser
python# 建议直接全局安装 会自动安装playwright以及chrome浏览器 npm install -g agent-browser agent-browser install # Download Chromium -
安装完成后测试
pythonagent-browser --headed open example.com # 可视化打开浏览器 能打开浏览器并访问example.com说明没问题

nanobot接入agent-browser
-
打开项目 https://github.com/vercel-labs/agent-browser/tree/main/skills
-
将这个目录下的agent-browser目录下载下来。
-
将下载的agent-browser目录复制到C:\Users\Administrator.nanobot\workspace\skills目录下。(根据你的.nanobot调整)
-
测试效果:

注意:agent-browser默认是用无头浏览器(不会打开浏览器)。你如果想看到浏览器操作过程,在提示词让他使用--headed。
总结
- nanobot 是 HKUDS 开源的轻量级 AI Agent 框架,支持对接主流大模型,通过 skills 体系扩展自动化能力;
- agent-browser 相比 playwright-mcp 更适配 AI 交互场景,具备自然语言理解、高容错性、轻量化部署等优势;
- nanobot 接入 agent-browser 的核心是复制官方 skills 插件到指定目录,无需修改核心代码,即可实现 AI 驱动的浏览器自动化。