使用 AI 控制浏览器:Browser Use 简介

什么是 Browser Use?

Browser Use 是一个开源工具,允许你使用 AI 控制浏览器。它通过连接 AI 代理与浏览器,实现自动化浏览器操作。这种技术可以帮助你完成复杂的任务,如自动化网页操作、数据收集等。

安装和使用

  1. 安装 Browser Use

    perl 复制代码
    bash
    pip install browser-use

    并安装 Playwright:

    复制代码
    bash
    playwright install chromium
  2. 设置环境变量

    .env 文件中添加你的 API 密钥(如 OpenAI API 密钥)。

  3. 运行示例代码

    python 复制代码
    python
    from langchain_openai import ChatOpenAI
    from browser_use import Agent
    import asyncio
    from dotenv import load_dotenv
    load_dotenv()
    
    async def main():
        agent = Agent(
            task="比较 gpt-4o 和 DeepSeek-V3 的价格",
            llm=ChatOpenAI(model="gpt-4o"),
        )
        await agent.run()
    
    asyncio.run(main())

示例任务

  • 添加购物车商品并结账
  • 将最新的 LinkedIn 关注者添加到 Salesforce 的潜在客户列表中
  • 读取简历,找到机器学习工作并保存到文件,然后在新标签页中申请这些工作
  • 在 Google Docs 中给父亲写信并保存为 PDF
  • 在 Hugging Face 上查找 cc-by-sa-4.0 许可的模型,按最多点赞排序,并保存前五名到文件

未来发展

Browser Use 的未来计划包括:

  • 改进代理记忆和规划能力
  • 增强 DOM 元素的提取和状态表示
  • 支持重复运行任务和使用 LLM 作为后备
  • 创建复杂任务的数据集并对比不同模型的性能

贡献和合作

欢迎通过 GitHub 提交 bug 报告或功能请求。Browser Use 还鼓励社区参与,共同定义 UI/UX 设计最佳实践,以提高 AI 代理的性能。

相关推荐
树獭叔叔1 分钟前
Node.js 多进程与多线程:从原理到实践
后端·node.js
csxin6 分钟前
使用 OAuth 2.0 Client 来管理Token,避免事故再次发生
后端
qianmoQ6 分钟前
GitHub 趋势日报 (2025年08月02日)
github
hqxstudying8 分钟前
前后端交流
java·css·后端·html·json
天真吴邪xie8 分钟前
项目上传到github中
github
这里有鱼汤9 分钟前
用卡尔曼滤波器计算个股票相对大盘的相关性——β值
后端·python
涡能增压发动积35 分钟前
动动嘴就能让浏览器自动来掘金签到?用这个Agent来帮你
后端
追逐时光者40 分钟前
C#/.NET/.NET Core优秀项目和框架2025年7月简报
后端·.net
think12340 分钟前
Nacos:微服务世界的"智能管家",让你的代码从此不再迷路
后端·spring cloud
青灯文案11 小时前
Spring Boot 的事务注解 @Transactional 失效的几种情况
java·spring boot·后端