浏览器自动化工具!开源 AI 浏览器助手让你效率翻倍
前言
在 AI 自动化快速发展的当下,浏览器早已不再只是"用来点点点"的工具。越来越多的网页任务------信息抓取、表单填写、跨站流程处理------都开始依赖自动化来提升效率。而最近,一款开源的浏览器自动化工具 Nanobrowser 引起了不少技术圈的关注。
它不仅免费、开源,还能在本地浏览器中直接运行 AI 自动化流程,让网页操作真正做到"像人一样执行"。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具,那么它绝对值得一试。

Nanobrowser是什么?
Nanobbrowser 是一款基于浏览器扩展运行的开源 AI 自动化工具,定位类似于 OpenAI Operator 的免费替代方案。它的核心理念是:让多个 AI 代理协同工作,自动完成复杂的网页任务。
它的特点非常鲜明:
核心优势
- 完全免费:无需订阅,只需使用自己的 LLM API Key。
- 隐私安全:所有操作在本地浏览器执行,敏感信息不会上传云端。
- 多模型支持:兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
- 开源透明:自动化逻辑完全公开,可审计、可扩展。
- 多代理协作:Planner 规划、Navigator 执行、Validator 校验,流程清晰可控。
相比传统的脚本自动化(如 Selenium),Nanobrowser 更像是"AI 驱动的智能浏览器助手",无需写代码即可完成复杂任务。
安装方式:三种模式
Nanobrowser 提供三种安装方式,适合不同用户需求。
1. Chrome Web Store(推荐)
适合普通用户,安装即用。

2. 手动安装最新版本
适合想体验最新功能的用户:
- 从 GitHub Releases 下载 zip
- 解压后,打开 Chrome 浏览器,进入
chrome://extensions/ - 开启右上角 "开发者模式",点击 "加载已解压的扩展程序",选择解压后的
nanobrowser文件夹; - 配置 API Key 和模型即可使用
3. 源码构建(开发者模式)
适合二次开发或想深度定制的用户。
安装 Node.js(v22.12.0+)和 pnpm(v9.15.1+)
git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser
#安装依赖:
pnpm install
#构建扩展:
pnpm build(构建结果在dist目录)
#加载扩展:参考手动安装步骤,选择dist文件夹
#开发模式(可选):
pnpm dev
实际使用体验
安装完成后,只需打开侧栏,添加模型服务商,即可开始使用。
点击"open settings" 添加大模型


Windows 下设置 OLLAMA_ORIGINS
步骤 1:打开系统环境变量
- 按 Win + S 搜索:
环境变量 - 点击:"编辑系统环境变量"
- 在弹出的窗口中点击:"环境变量(N)..."
步骤 2:新增系统变量
在"系统变量"区域点击 新建:
-
变量名:
OLLAMA_ORIGINS
-
变量值:
chrome-extension://*
点击 确定 保存。

步骤 3:重启 Ollama 服务
你可以直接重启电脑,或者手动重启 Ollama:
Windows 下设置(临时生效)
如果你只想当前 PowerShell 会话生效,可以用:
powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"
⚠️ 注意: setx 会写入注册表,但不会影响当前窗口,需要 重新打开 PowerShell 或重启电脑 才生效。
如何验证是否设置成功?
打开新的 PowerShell:
echo $env:OLLAMA_ORIGINS
chrome-extension://*

说明设置成功。
例如输入 搜索"人工智能",AI 会自动:
- 分析当前网页结构
- 识别可操作元素
- 自动执行浏览、抓取、整理等步骤
- 最终输出结构化结果

整个过程无需你手动点击,AI 会像一个熟练的网页操作员一样完成任务。
打开闲鱼
大模型: ollama,qwen3b:20b
给它一个指令"打开闲鱼,搜索2T硬盘,并得到结果"。

改成
打开"https://www.goofish.com/" 搜索2T硬盘,并得到结果

使用大模型: kimi

报错:你使用的模型不支持 Structured Output
Planning failed: Failed to invoke gpt-oss:20b with structured output:
Could not parse response with structured output

例如:
gpt-oss:20b- 某些本地模型(Ollama)
- 某些开源模型(Qwen、Llama、Mixtral 的部分版本)
这些模型 能聊天,但不能严格按 JSON / Schema 输出,导致 Planner 解析失败。
解决方案
把 Planner 模型 换成一个支持结构化输出的模型,例如:
- GPT-4 系列
- GPT-4o 系列
- Claude 3 系列
- Gemini 2 系列
- Qwen2.5(部分版本支持)
不要用本地模型当 Planner。
Nanobrowser的缺点
1.模型兼容性限制明显(最大痛点)
Planner 必须使用支持 Structured Output 的模型
- 本地模型(Ollama)大多不支持
- Kimi(Moonshot)不支持
- 大部分开源模型不支持
- 代理 API(如 gpt-oss)也不完全兼容
导致:Planner 只能用 GPT-4o / Claude / Gemini 等强模型,成本较高。
2. Structured Output 错误频发
常见报错:
- Could not parse response
- Invalid json_schema
- Unsupported keywords: $schema
这些都来自模型不兼容。
总结
Nanobrowser 作为一款开源、免费、隐私友好的 AI 浏览器自动化工具,正在重新定义网页操作方式。
开源地址:https://github.com/nanobrowser/nanobrowser
-
它更适合:
- 技术用户
- 自动化爱好者
- 需要本地隐私的场景
- 想用 AI 做网页自动化的开发者
不太适合:
- 完全小白
- 企业级 RPA 场景
- 需要高稳定性的任务
无论你是技术爱好者、数据采集人员、运营从业者,还是想提升效率的普通用户,它都能带来显著的效率提升。
如果你想体验真正的 AI 自动化浏览器,不妨试试 Nanobrowser。