AI自动化黑马！3B小模型吊打GPT-4？这款开源神器让AI替你上班！

我们每天可能都重复着某些工作内容：登录后台导出数据、填写繁琐的Web表单、跨系统发布信息......

明明都是标准化流程，却要耗费大量人力。更糟糕的是，当你想用AI自动化时，要么遇到天价API费用，要么被复杂的环境依赖劝退。

Proxy Lite 的开源，给你丝滑便捷的自动化操作体验。

这个仅3B参数的开源视觉语言模型 (VLM)，能像真人一样观察浏览器、思考决策、操作网页，将重复性工作自动化成本降至冰点，完全解放你的双手。

不仅具备强大的网页自动化能力，还能在 超低资源占用 的情况下提供企业级浏览器控制能力，也为开源社区带来了全新的 AI 代理体验。

1、轻量级 VLM，低资源占用

仅 3B 参数，相比于动辄 10B+ 的 VLM，Proxy Lite 资源占用极低，可在消费级 GPU 运行。

可高效执行网络自动化任务，无需依赖大型云计算资源，即可实现网页交互、数据抓取、自动表单填写等任务。

2、提供VLM-浏览器交互框架

内置了一套完整的浏览器交互控制框架，使 AI 代理可以像人类一样与网页进行交互。

适用于网页抓取、自动化测试、数据录入、Web 应用交互、任务执行等多种场景，帮助开发者更轻松地构建 AI 驱动的浏览器控制系统。

3、三步响应机制，提高泛化能力

采用了 观察-思考-工具调用 三步决策流程，远超传统的 Prompt-预测方式，使得模型在处理复杂任务时具备更强的泛化能力。

这一机制让 Proxy Lite 能够自主规划任务，适应不同网页环境，提高任务完成率。

4、借鉴 DeepSeek R1 反馈机制

借鉴了 DeepSeek R1 等模型的执行反馈机制，让模型能够在网页任务中不断优化决策流程，提升执行准确性。

Proxy Lite 可快速在本地进行部署，具体步骤如下：

① 克隆项目

bash 复制代码

git clone https://github.com/convergence-ai/proxy-lite.git

② 一键设置环境

go 复制代码

make proxy

或者手工安装环境

css 复制代码

pip install uv
uv venv --python 3.11 --python-preference managed
uv sync
uv pip install -e .
playwright install

③ 使用

使用帮助可以执行以下命令查看：

bash 复制代码

proxy --help

在 Proxy Lite 运行任务

arduino 复制代码

proxy "Find some markets near Kings Cross and tell me their ratings."

或者你可以使用以下命令运行本地网络界面：

go 复制代码

make app

更多高级用法可参考项目说明。

Proxy Lite 适用于各种网页自动化和 AI 代理任务，包括但不限于：

Proxy Lite 作为开源、轻量级的 AI 代理助手，在网页自动化、浏览器交互、任务泛化方面都展现了极大的潜力。

它提供了仅 3B 参数的高效推理能力，并结合观察-思考-工具调用三步决策机制，能够精准执行复杂的 Web 任务，相比现有大模型代理助手更加轻量、易用、泛化能力更强。