零成本上线!用 Hugging Face免费服务器+Docker 快速部署HertzBeat 监控平台

浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍

前言

在 AI 自动化快速发展的当下,浏览器早已不再只是"用来点点点"的工具。越来越多的网页任务------信息抓取、表单填写、跨站流程处理------都开始依赖自动化来提升效率。而最近,一款开源的浏览器自动化工具 Nanobrowser 引起了不少技术圈的关注。

它不仅免费、开源,还能在本地浏览器中直接运行 AI 自动化流程,让网页操作真正做到"像人一样执行"。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具,那么它绝对值得一试。

Nanobrowser是什么?

Nanobbrowser 是一款基于浏览器扩展运行的开源 AI 自动化工具,定位类似于 OpenAI Operator 的免费替代方案。它的核心理念是:让多个 AI 代理协同工作,自动完成复杂的网页任务

它的特点非常鲜明:

核心优势

  • 完全免费:无需订阅,只需使用自己的 LLM API Key。
  • 隐私安全:所有操作在本地浏览器执行,敏感信息不会上传云端。
  • 多模型支持:兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
  • 开源透明:自动化逻辑完全公开,可审计、可扩展。
  • 多代理协作:Planner 规划、Navigator 执行、Validator 校验,流程清晰可控。

相比传统的脚本自动化(如 Selenium),Nanobrowser 更像是"AI 驱动的智能浏览器助手",无需写代码即可完成复杂任务。

安装方式:三种模式

Nanobrowser 提供三种安装方式,适合不同用户需求。

1. Chrome Web Store(推荐)

适合普通用户,安装即用。

2. 手动安装最新版本

适合想体验最新功能的用户:

  • 从 GitHub Releases 下载 zip
  • 解压后,打开 Chrome 浏览器,进入chrome://extensions/
  • 开启右上角 "开发者模式",点击 "加载已解压的扩展程序",选择解压后的nanobrowser文件夹;
  • 配置 API Key 和模型即可使用

3. 源码构建(开发者模式)

适合二次开发或想深度定制的用户。

复制代码
安装 Node.js(v22.12.0+)和 pnpm(v9.15.1+)

git clone https://github.com/nanobrowser/nanobrowser.git 
cd nanobrowser

#安装依赖:
pnpm install

#构建扩展:
pnpm build(构建结果在dist目录)

#加载扩展:参考手动安装步骤,选择dist文件夹

#开发模式(可选):
pnpm dev

实际使用体验

安装完成后,只需打开侧栏,添加模型服务商,即可开始使用。

点击"open settings" 添加大模型

Windows 下设置 OLLAMA_ORIGINS

步骤 1:打开系统环境变量

  1. Win + S 搜索:环境变量
  2. 点击:"编辑系统环境变量"
  3. 在弹出的窗口中点击:"环境变量(N)..."

步骤 2:新增系统变量

在"系统变量"区域点击 新建

  • 变量名:

    OLLAMA_ORIGINS

  • 变量值:

    chrome-extension://*

点击 确定 保存。

步骤 3:重启 Ollama 服务

你可以直接重启电脑,或者手动重启 Ollama:

Windows 下设置(临时生效)

如果你只想当前 PowerShell 会话生效,可以用:

复制代码
powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"

⚠️ 注意: setx 会写入注册表,但不会影响当前窗口,需要 重新打开 PowerShell 或重启电脑 才生效。

如何验证是否设置成功?

打开新的 PowerShell:

复制代码
echo $env:OLLAMA_ORIGINS

chrome-extension://*

说明设置成功。

例如输入 搜索"人工智能",AI 会自动:

  1. 分析当前网页结构
  2. 识别可操作元素
  3. 自动执行浏览、抓取、整理等步骤
  4. 最终输出结构化结果

整个过程无需你手动点击,AI 会像一个熟练的网页操作员一样完成任务。

打开闲鱼

大模型: ollama,qwen3b:20b

给它一个指令"打开闲鱼,搜索2T硬盘,并得到结果"。

改成

复制代码
打开"https://www.goofish.com/" 搜索2T硬盘,并得到结果

使用大模型: kimi

报错:你使用的模型不支持 Structured Output

复制代码
Planning failed: Failed to invoke gpt-oss:20b with structured output: 
Could not parse response with structured output

例如:

  • gpt-oss:20b
  • 某些本地模型(Ollama)
  • 某些开源模型(Qwen、Llama、Mixtral 的部分版本)

这些模型 能聊天,但不能严格按 JSON / Schema 输出,导致 Planner 解析失败。

解决方案

Planner 模型 换成一个支持结构化输出的模型,例如:

  • GPT-4 系列
  • GPT-4o 系列
  • Claude 3 系列
  • Gemini 2 系列
  • Qwen2.5(部分版本支持)

不要用本地模型当 Planner。

Nanobrowser的缺点

1.模型兼容性限制明显(最大痛点)

Planner 必须使用支持 Structured Output 的模型

  • 本地模型(Ollama)大多不支持
  • Kimi(Moonshot)不支持
  • 大部分开源模型不支持
  • 代理 API(如 gpt-oss)也不完全兼容

导致:Planner 只能用 GPT-4o / Claude / Gemini 等强模型,成本较高。

2. Structured Output 错误频发

常见报错:

  • Could not parse response
  • Invalid json_schema
  • Unsupported keywords: $schema

这些都来自模型不兼容。

总结

Nanobrowser 作为一款开源、免费、隐私友好的 AI 浏览器自动化工具,正在重新定义网页操作方式。

开源地址:https://github.com/nanobrowser/nanobrowser

  • 它更适合:

    • 技术用户
    • 自动化爱好者
    • 需要本地隐私的场景
    • 想用 AI 做网页自动化的开发者

    不太适合:

    • 完全小白
    • 企业级 RPA 场景
    • 需要高稳定性的任务

无论你是技术爱好者、数据采集人员、运营从业者,还是想提升效率的普通用户,它都能带来显著的效率提升。

如果你想体验真正的 AI 自动化浏览器,不妨试试 Nanobrowser。

相关推荐
魂之木1 小时前
【零基础教程】基于Docker的RabbitMQ部署方案
分布式·docker·微服务·rabbitmq
cly12 小时前
Jenkins CI/CD 平台详解
运维·ci/cd·jenkins
skywalk81632 小时前
Ubuntu宽屏显示器只有4:3分辨率问题的解决:用cvt和xrandr命令查看并配置显卡分辨率到1440x900
linux·运维·ubuntu·显示
十月南城2 小时前
微服务化的收益与成本复盘——技术、组织与运维维度的综合账本
运维·微服务·云计算
石小千2 小时前
Jenkins服务器上排查npm编译依赖包错误问题
服务器·npm·jenkins
小码吃趴菜2 小时前
tcp连结建立与断开(三握手四挥手)
服务器·网络·tcp/ip
warton882 小时前
ubuntu24下操作配置mysql8相关目录到指定地址
linux·运维·mysql
damon087082 小时前
nodejs 实现 企业微信 自定义应用 接收消息服务器配置和实现
服务器·前端·企业微信
步步为营DotNet2 小时前
深度解析.NET 中IAsyncEnumerable:异步迭代的高效实现与应用】
服务器·数据库·.net