nanobot安装部署-并接入agent-browser实现浏览器自动化操作

nanobot安装部署-并接入agent-browser实现浏览器自动化操作

关于 nanobot

nanobot 是由香港大学数据科学学院(HKUDS)开源的一款轻量级、可扩展的 AI 智能体框架,核心定位是让开发者能够快速构建、部署和运行具备工具调用能力的 AI Agent。它的设计理念是低代码 / 无代码化实现 AI 驱动的自动化任务,支持对接主流大模型(如 Claude、OpenAI、DeepSeek 等),并通过插件化的 skills 体系扩展智能体能力,尤其擅长将自然语言指令转化为可执行的自动化操作,是 AI 原生自动化领域的高效工具。(轻量版openclaw)

关于 agent-browser

agent-browser 是 Vercel Labs 推出的专为 AI Agent 设计的浏览器自动化工具,基于 Playwright 内核深度优化,但针对 AI 交互场景做了大量适配。它的核心优势是自然语言友好性操作鲁棒性------ 相比传统的浏览器自动化工具,agent-browser 能直接理解 AI 生成的自然语言指令,无需开发者手动编写定位元素、模拟点击等底层代码,同时内置了更智能的页面加载等待、元素定位容错机制,大幅降低 AI 驱动浏览器自动化的落地门槛。

为什么选择 agent-browser 而非 playwright-mcp

nanobot 的默认浏览器自动化依赖 playwright-mcp(openclaw 默认组件),但在实际使用中,agent-browser 展现出更优的适配性:

  1. AI 指令理解更精准:playwright-mcp 需要严格的结构化指令(如指定 selector、操作类型),而 agent-browser 可直接解析自然语言(如 "点击页面右上角的登录按钮"),无需人工转换指令格式;
  2. 容错性更强:面对动态加载页面、元素位置变化等场景,agent-browser 内置了智能重试和元素模糊匹配机制,而 playwright-mcp 易因元素定位失败导致任务中断;
  3. 部署更轻量化:agent-browser 提供全局 npm 安装方式,自动集成 Chromium 浏览器和依赖,无需手动配置 Playwright 环境;
  4. 与 nanobot 的 skills 体系无缝兼容:agent-browser 官方提供了适配 nanobot 的 skills 插件,直接复制即可接入,无需二次开发适配。

安装nanobot

项目参考:https://github.com/HKUDS/nanobot

提供的安装方式:

python 复制代码
# Install from source (latest features, recommended for development)

git clone https://github.com/HKUDS/nanobot.git
cd nanobot
pip install -e .

# Install with uv (stable, fast)
uv tool install nanobot-ai

# Install from PyPI (stable)
pip install nanobot-ai

如果你想直接用官方能力,不需要调试代码或者二次开发可以直接使用uv或者pip的方式进行安装。这里演示使用pip进行安装:

python 复制代码
# 创建一个虚拟环境
conda create --name nanobot python=3.12
conda activate nanobot

pip install nanobot-ai -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/

使用

初始化配置
python 复制代码
# 1. 先初始化
nanobot onboard  # 一般会生成 C:\Users\Administrator\.nanobot  这个目录
                 # 初始化过程会让你输入一些配置比如模型配置,可以直接输入。也可以后续手动在config.json配置。

# 2. 在.nanobot目录下配置config.json文件  配置模型
## 配置模型名称、模型apikey  根据你使用的模型厂商进行选择。

"agents": {
    "defaults": {
      "workspace": "~/.nanobot/workspace",
      "model": "claude-4.5-sonnet",  # 配置模型名称
      "maxTokens": 12000,
      "temperature": 0.1,
      "maxToolIterations": 40,
      "memoryWindow": 100
    }
  },

    "providers": {
    "custom": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "anthropic": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "openai": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "openrouter": {
      "apiKey": "ailab_SuX2usnfxFWQCisJoje5g6aa4ICIXOMlBRedkxS2b8TCMGWpVYBtu7eiovL+UgZejykWCOPDeurZixjlOGU2GhUGU=",
      "apiBase": "https://*****/v1/chat/completions",
      "extraHeaders": null
    },
    "deepseek": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
常见配置

nanobot的memory和skills存储在下面的目录:如果你要扩展其他地方的skills,直接放到下面的skills目录下。后面会放入agent-browser的skills,用于操作浏览器自动化。

对话
复制代码
nanobot agent  # 开启智能对话

安装agent-browser

安装

  1. 首先安装npm(自行百度或者豆包)

  2. 安装agent-browser

    python 复制代码
    # 建议直接全局安装  会自动安装playwright以及chrome浏览器
    npm install -g agent-browser
    agent-browser install  # Download Chromium
  3. 安装完成后测试

    python 复制代码
    agent-browser --headed open example.com  # 可视化打开浏览器  能打开浏览器并访问example.com说明没问题

nanobot接入agent-browser

  1. 打开项目 https://github.com/vercel-labs/agent-browser/tree/main/skills

  2. 将这个目录下的agent-browser目录下载下来。

  3. 将下载的agent-browser目录复制到C:\Users\Administrator.nanobot\workspace\skills目录下。(根据你的.nanobot调整)

  4. 测试效果:

    注意:agent-browser默认是用无头浏览器(不会打开浏览器)。你如果想看到浏览器操作过程,在提示词让他使用--headed。

总结

  1. nanobot 是 HKUDS 开源的轻量级 AI Agent 框架,支持对接主流大模型,通过 skills 体系扩展自动化能力;
  2. agent-browser 相比 playwright-mcp 更适配 AI 交互场景,具备自然语言理解、高容错性、轻量化部署等优势;
  3. nanobot 接入 agent-browser 的核心是复制官方 skills 插件到指定目录,无需修改核心代码,即可实现 AI 驱动的浏览器自动化。
相关推荐
<-->2 小时前
SGLang 相比 vLLM 的主要优势
人工智能·pytorch·python·transformer
nn在炼金2 小时前
大模型提示词工程指南:从基础Prompt到Agent、Skill、SSD全流程落地
人工智能·prompt
Le0v1n2 小时前
静态Embedding v.s. 动态上下文Embedding:NLP词向量的本质差异与落地全解
人工智能·自然语言处理·embedding
smileNicky2 小时前
Spring AI系列之核心组件:ChatClient、Prompt 与 Advisor
人工智能·spring·prompt
AI人工智能+2 小时前
食品经营许可证识别技术:基于深度学习的高精度OCR解决方案
深度学习·ocr·食品经营许可证识别
聊聊科技2 小时前
原创音乐人创作编曲伴奏新方式,清唱歌词的音频配合AI编曲软件超好用
人工智能·音视频
北京软秦科技有限公司2 小时前
IACheck AI报告文档审核:高端制造标准引用报告审核的智能导航
大数据·人工智能·制造
爱打代码的小林2 小时前
YOLOv4介绍
人工智能·计算机视觉·目标跟踪
新元代码2 小时前
OpenClaw 小白入门十问十答
人工智能