超火的AI自动化操控浏览器神器!一夜爆火,5天内新增3K Star!AI智能体趋势使然。

在科技飞速发展的今天,我们的工作、生活与 AI 的关系正变得越来越紧密。

无论是语音助手解放双手,还是AI搜索节省时间,这些技术的普及无不在证明:AI 的价值不再只是科研实验室中的概念,而是实实在在融入了我们的日常生活。

然而,当我发现 Browser Use 这个工具时,还是被它的"开挂"能力给惊艳到了。

它允许通过 AI 代理自动操作浏览器,无论是发邮件、订机票,还是网页内容提取、文件存储、数据库操作等都直接用。

项目简介

Browser Use 是一个能让 AI 智能体自动化操作浏览器的开源工具。

它通过简单的几行代码,就能让 AI 模型像真人一样与网页互动,完成各种复杂任务,比如自动投简历、查询航班信息,甚至筛选模型。

底层也借助了微软的自动化框架 playwright 进行功能延展。

它可以用于多种用途,包括视觉识别、多个代理的并行管理以及多个标签页的自动管理。

11月刚刚开源,最近一周突然爆火,5天内标星数直接从 3.3k 飙升到 7.3k。

主要功能

  • 自动化操作浏览器:可以自动操作浏览器,与网页交互,比如点击、填写表单、下载文件等,就像真人一样流畅。

  • 视觉识别与HTML提取:内置的视觉识别功能和 HTML 元素解析工具,能帮助 AI 识别网页中的动态内容并作出准确判断。

  • 自动多标签管理:支持自动管理多个浏览器标签页,智能调度任务。还可以并行多个 AI 智能体,分别处理不同任务,提高效率。

  • 支持主流 LLM 模型:兼容 GPT-4o、Claude 3.5 Sonnet 等主流大模型,充分发挥 AI 的理解与决策能力。

  • 自定义操作:允许用户定义个性化的任务流程,让工具更加适配具体需求。

快速使用

安装 browser-use

perl 复制代码
pip install browser-use

将API密钥添加到你的.env文件中

ini 复制代码
OPENAI_API_KEY=
ANTHROPIC_API_KEY=

启动代理

css 复制代码
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="Find a one-way flight from Bali to Oman on 12 January 2025 on Google Flights. Return me the cheapest option.",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

最后自动开启浏览器进行操作。

比如,投简历这件事本身并不复杂,但在不同网站间反复切换、手动输入信息却非常耗时。

可以通过 Browser Use 设计一个简单的脚本,让它自动打开招聘网站、登录账户、上传简历、甚至自定义申请留言。整个过程只需要提前设置好脚本,之后就可以坐等结果。

官方示例

1、阅读简历,找到与机器学习相关的职位,将它们保存到文件中,然后在新标签页中开始投递。

2、从2024年12月25日至2025年2月2日期间,在某平台上查找从苏黎世到北京的航班。

3、查找拥有cc-by-sa-4.0许可的模型,并按在Hugging Face上获得的最多点赞进行排序,将前5个保存到文件。

写在最后

Browser Use 是一款功能强大且灵活的开源工具,可以将 AI 智能体与浏览器操作完美结合,实现自动化、高效的网页交互。

不论是日常办公、信息查询,还是数据采集,都能大大节省人力和时间成本。

GitHub 项目地址:github.com/browser-use...

相关推荐
ai小鬼头1 小时前
Ollama+OpenWeb最新版0.42+0.3.35一键安装教程,轻松搞定AI模型部署
后端·架构·github
九年义务漏网鲨鱼1 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
元宇宙时间2 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享2 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾2 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性
老任与码2 小时前
Spring AI Alibaba(1)——基本使用
java·人工智能·后端·springaialibaba
蹦蹦跳跳真可爱5892 小时前
Python----OpenCV(图像増强——高通滤波(索贝尔算子、沙尔算子、拉普拉斯算子),图像浮雕与特效处理)
人工智能·python·opencv·计算机视觉
雷羿 LexChien3 小时前
从 Prompt 管理到人格稳定:探索 Cursor AI 编辑器如何赋能 Prompt 工程与人格风格设计(上)
人工智能·python·llm·编辑器·prompt
两棵雪松3 小时前
如何通过向量化技术比较两段文本是否相似?
人工智能
heart000_13 小时前
128K 长文本处理实战:腾讯混元 + 云函数 SCF 构建 PDF 摘要生成器
人工智能·自然语言处理·pdf