nanobot安装部署-并接入agent-browser实现浏览器自动化操作

nanobot安装部署-并接入agent-browser实现浏览器自动化操作

关于 nanobot

nanobot 是由香港大学数据科学学院(HKUDS)开源的一款轻量级、可扩展的 AI 智能体框架,核心定位是让开发者能够快速构建、部署和运行具备工具调用能力的 AI Agent。它的设计理念是低代码 / 无代码化实现 AI 驱动的自动化任务,支持对接主流大模型(如 Claude、OpenAI、DeepSeek 等),并通过插件化的 skills 体系扩展智能体能力,尤其擅长将自然语言指令转化为可执行的自动化操作,是 AI 原生自动化领域的高效工具。(轻量版openclaw)

关于 agent-browser

agent-browser 是 Vercel Labs 推出的专为 AI Agent 设计的浏览器自动化工具,基于 Playwright 内核深度优化,但针对 AI 交互场景做了大量适配。它的核心优势是自然语言友好性操作鲁棒性------ 相比传统的浏览器自动化工具,agent-browser 能直接理解 AI 生成的自然语言指令,无需开发者手动编写定位元素、模拟点击等底层代码,同时内置了更智能的页面加载等待、元素定位容错机制,大幅降低 AI 驱动浏览器自动化的落地门槛。

为什么选择 agent-browser 而非 playwright-mcp

nanobot 的默认浏览器自动化依赖 playwright-mcp(openclaw 默认组件),但在实际使用中,agent-browser 展现出更优的适配性:

  1. AI 指令理解更精准:playwright-mcp 需要严格的结构化指令(如指定 selector、操作类型),而 agent-browser 可直接解析自然语言(如 "点击页面右上角的登录按钮"),无需人工转换指令格式;
  2. 容错性更强:面对动态加载页面、元素位置变化等场景,agent-browser 内置了智能重试和元素模糊匹配机制,而 playwright-mcp 易因元素定位失败导致任务中断;
  3. 部署更轻量化:agent-browser 提供全局 npm 安装方式,自动集成 Chromium 浏览器和依赖,无需手动配置 Playwright 环境;
  4. 与 nanobot 的 skills 体系无缝兼容:agent-browser 官方提供了适配 nanobot 的 skills 插件,直接复制即可接入,无需二次开发适配。

安装nanobot

项目参考:https://github.com/HKUDS/nanobot

提供的安装方式:

python 复制代码
# Install from source (latest features, recommended for development)

git clone https://github.com/HKUDS/nanobot.git
cd nanobot
pip install -e .

# Install with uv (stable, fast)
uv tool install nanobot-ai

# Install from PyPI (stable)
pip install nanobot-ai

如果你想直接用官方能力,不需要调试代码或者二次开发可以直接使用uv或者pip的方式进行安装。这里演示使用pip进行安装:

python 复制代码
# 创建一个虚拟环境
conda create --name nanobot python=3.12
conda activate nanobot

pip install nanobot-ai -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/

使用

初始化配置
python 复制代码
# 1. 先初始化
nanobot onboard  # 一般会生成 C:\Users\Administrator\.nanobot  这个目录
                 # 初始化过程会让你输入一些配置比如模型配置,可以直接输入。也可以后续手动在config.json配置。

# 2. 在.nanobot目录下配置config.json文件  配置模型
## 配置模型名称、模型apikey  根据你使用的模型厂商进行选择。

"agents": {
    "defaults": {
      "workspace": "~/.nanobot/workspace",
      "model": "claude-4.5-sonnet",  # 配置模型名称
      "maxTokens": 12000,
      "temperature": 0.1,
      "maxToolIterations": 40,
      "memoryWindow": 100
    }
  },

    "providers": {
    "custom": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "anthropic": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "openai": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
    "openrouter": {
      "apiKey": "ailab_SuX2usnfxFWQCisJoje5g6aa4ICIXOMlBRedkxS2b8TCMGWpVYBtu7eiovL+UgZejykWCOPDeurZixjlOGU2GhUGU=",
      "apiBase": "https://*****/v1/chat/completions",
      "extraHeaders": null
    },
    "deepseek": {
      "apiKey": "",
      "apiBase": null,
      "extraHeaders": null
    },
常见配置

nanobot的memory和skills存储在下面的目录:如果你要扩展其他地方的skills,直接放到下面的skills目录下。后面会放入agent-browser的skills,用于操作浏览器自动化。

对话
复制代码
nanobot agent  # 开启智能对话

安装agent-browser

安装

  1. 首先安装npm(自行百度或者豆包)

  2. 安装agent-browser

    python 复制代码
    # 建议直接全局安装  会自动安装playwright以及chrome浏览器
    npm install -g agent-browser
    agent-browser install  # Download Chromium
  3. 安装完成后测试

    python 复制代码
    agent-browser --headed open example.com  # 可视化打开浏览器  能打开浏览器并访问example.com说明没问题

nanobot接入agent-browser

  1. 打开项目 https://github.com/vercel-labs/agent-browser/tree/main/skills

  2. 将这个目录下的agent-browser目录下载下来。

  3. 将下载的agent-browser目录复制到C:\Users\Administrator.nanobot\workspace\skills目录下。(根据你的.nanobot调整)

  4. 测试效果:

    注意:agent-browser默认是用无头浏览器(不会打开浏览器)。你如果想看到浏览器操作过程,在提示词让他使用--headed。

总结

  1. nanobot 是 HKUDS 开源的轻量级 AI Agent 框架,支持对接主流大模型,通过 skills 体系扩展自动化能力;
  2. agent-browser 相比 playwright-mcp 更适配 AI 交互场景,具备自然语言理解、高容错性、轻量化部署等优势;
  3. nanobot 接入 agent-browser 的核心是复制官方 skills 插件到指定目录,无需修改核心代码,即可实现 AI 驱动的浏览器自动化。
相关推荐
Cosolar20 小时前
RAG(检索增强生成)面试指南
人工智能·aigc·openai
90后的晨仔20 小时前
MP4 转 GIF 完整技术指南:从原理到实践
人工智能
新缸中之脑21 小时前
Google Stitch 产品设计实测
人工智能
Slow菜鸟1 天前
AI学习篇(三) | AI效率工具指南(2026年)
人工智能·学习
北京软秦科技有限公司1 天前
AI审核如何助力合规取证?IACheck打造环境检测报告电子存证与法律风险防控新路径
大数据·人工智能
qq_359716231 天前
openpi使用过程中相关问题
人工智能·深度学习·机器学习
minhuan1 天前
医疗AI智能体:从数据到关怀人文设计:告别冰冷精准,构建有温度的诊疗交互.131
人工智能·ai智能体·智能体的人文设计·医疗ai人文设计·构建医疗ai智能体
Promise微笑1 天前
驾驭AI引用:Geo优化中的内容评分机制与实战策略深度解析
人工智能
ai生成式引擎优化技术1 天前
全球唯一四元结构底层架构问世:TSPR-WEB-LLM-HIC v2.0 终结大模型投毒与幻觉的终极技术范式
人工智能