零成本上线！用 Hugging Face免费服务器+Docker 快速部署HertzBeat 监控平台

浏览器自动化工具！开源 AI 浏览器助手让你效率翻倍

前言

在 AI 自动化快速发展的当下，浏览器早已不再只是"用来点点点"的工具。越来越多的网页任务------信息抓取、表单填写、跨站流程处理------都开始依赖自动化来提升效率。而最近，一款开源的浏览器自动化工具 Nanobrowser 引起了不少技术圈的关注。

它不仅免费、开源，还能在本地浏览器中直接运行 AI 自动化流程，让网页操作真正做到"像人一样执行"。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具，那么它绝对值得一试。

Nanobrowser是什么？

Nanobbrowser 是一款基于浏览器扩展运行的开源 AI 自动化工具，定位类似于 OpenAI Operator 的免费替代方案。它的核心理念是：让多个 AI 代理协同工作，自动完成复杂的网页任务。

它的特点非常鲜明：

核心优势

完全免费：无需订阅，只需使用自己的 LLM API Key。
隐私安全：所有操作在本地浏览器执行，敏感信息不会上传云端。
多模型支持：兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
开源透明：自动化逻辑完全公开，可审计、可扩展。
多代理协作：Planner 规划、Navigator 执行、Validator 校验，流程清晰可控。

相比传统的脚本自动化（如 Selenium），Nanobrowser 更像是"AI 驱动的智能浏览器助手"，无需写代码即可完成复杂任务。

安装方式：三种模式

Nanobrowser 提供三种安装方式，适合不同用户需求。

1. Chrome Web Store（推荐）

适合普通用户，安装即用。

2. 手动安装最新版本

适合想体验最新功能的用户：

从 GitHub Releases 下载 zip
解压后，打开 Chrome 浏览器，进入chrome://extensions/
开启右上角 "开发者模式"，点击 "加载已解压的扩展程序"，选择解压后的nanobrowser文件夹；
配置 API Key 和模型即可使用

3. 源码构建（开发者模式）

适合二次开发或想深度定制的用户。

复制代码

安装 Node.js（v22.12.0+）和 pnpm（v9.15.1+）

git clone https://github.com/nanobrowser/nanobrowser.git 
cd nanobrowser

#安装依赖：
pnpm install

#构建扩展：
pnpm build（构建结果在dist目录）

#加载扩展：参考手动安装步骤，选择dist文件夹

#开发模式（可选）：
pnpm dev

实际使用体验

安装完成后，只需打开侧栏，添加模型服务商，即可开始使用。

点击"open settings" 添加大模型

Windows 下设置 OLLAMA_ORIGINS

步骤 1：打开系统环境变量

按 Win + S 搜索：环境变量
点击："编辑系统环境变量"
在弹出的窗口中点击："环境变量(N)..."

步骤 2：新增系统变量

在"系统变量"区域点击新建：

变量名：

OLLAMA_ORIGINS
变量值：

chrome-extension://*

点击确定保存。

步骤 3：重启 Ollama 服务

你可以直接重启电脑，或者手动重启 Ollama：

Windows 下设置（临时生效)

如果你只想当前 PowerShell 会话生效，可以用：

复制代码

powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"

⚠️ 注意： setx 会写入注册表，但不会影响当前窗口，需要 重新打开 PowerShell 或重启电脑 才生效。

如何验证是否设置成功？

打开新的 PowerShell：

复制代码

echo $env:OLLAMA_ORIGINS

chrome-extension://*

说明设置成功。

例如输入搜索"人工智能"，AI 会自动：

分析当前网页结构
识别可操作元素
自动执行浏览、抓取、整理等步骤
最终输出结构化结果

整个过程无需你手动点击，AI 会像一个熟练的网页操作员一样完成任务。

打开闲鱼

大模型： ollama，qwen3b:20b

给它一个指令"打开闲鱼，搜索2T硬盘，并得到结果"。

改成

复制代码

打开"https://www.goofish.com/" 搜索2T硬盘，并得到结果

使用大模型： kimi

报错：你使用的模型不支持 Structured Output

复制代码

Planning failed: Failed to invoke gpt-oss:20b with structured output: 
Could not parse response with structured output

例如：

gpt-oss:20b
某些本地模型（Ollama）
某些开源模型（Qwen、Llama、Mixtral 的部分版本）

这些模型 能聊天，但不能严格按 JSON / Schema 输出，导致 Planner 解析失败。

解决方案

把 Planner 模型 换成一个支持结构化输出的模型，例如：

GPT-4 系列
GPT-4o 系列
Claude 3 系列
Gemini 2 系列
Qwen2.5（部分版本支持）

不要用本地模型当 Planner。

Nanobrowser的缺点

1.模型兼容性限制明显（最大痛点）

Planner 必须使用支持 Structured Output 的模型

本地模型（Ollama）大多不支持
Kimi（Moonshot）不支持
大部分开源模型不支持
代理 API（如 gpt-oss）也不完全兼容

导致：Planner 只能用 GPT-4o / Claude / Gemini 等强模型，成本较高。

2. Structured Output 错误频发

常见报错：

Could not parse response
Invalid json_schema
Unsupported keywords: $schema

这些都来自模型不兼容。

总结

Nanobrowser 作为一款开源、免费、隐私友好的 AI 浏览器自动化工具，正在重新定义网页操作方式。

开源地址：https://github.com/nanobrowser/nanobrowser

它更适合：
- 技术用户
- 自动化爱好者
- 需要本地隐私的场景
- 想用 AI 做网页自动化的开发者
不太适合：
- 完全小白
- 企业级 RPA 场景
- 需要高稳定性的任务

无论你是技术爱好者、数据采集人员、运营从业者，还是想提升效率的普通用户，它都能带来显著的效率提升。

如果你想体验真正的 AI 自动化浏览器，不妨试试 Nanobrowser。