Browser-Use WebUI项目启动指南

摘要

此前发布《Browser - Use WebUI 使用体验》博文后,鉴于部分朋友运行时出现问题,重新运行并整理相关内容。本文详细记录 Web UI 项目启动全过程,涵盖 Python 3.11+、Chrome 浏览器及 API Keys 等环境要求,Python 环境检查、依赖安装等环境配置步骤,.env 文件中环境变量的设置方法。同时,针对启动中如 lxml.html.clean 依赖缺失、连接被拒等问题给出解决方案,介绍启动命令、访问方式、故障排查建议,以及日志级别设置与支持的 LLM 模型等,还提供官方文档供参考 。

引言

之前写了一篇《Browser-Use WebUI 使用体验》的博文,有些朋友可能在运行过程中出现了一些问题,所以今天,我重新运行了一次,并对其中可能出现的问题,简单整理了一下:

Web UI 项目启动指南

本文档记录了启动 Web UI 项目的完整过程,包括环境配置、遇到的问题及其解决方案。

1. 环境要求

  • Python 3.11 或更高版本
  • Chrome 浏览器(用于浏览器自动化)
  • 相关 API Keys(支持多个 LLM 提供商)

2. 环境配置

2.1 Python 环境检查

bash 复制代码
python --version
# 输出: Python 3.11.5

2.2 安装项目依赖

bash 复制代码
pip install -r requirements.txt

依赖包括:

  • browser-use==0.1.18
  • langchain-google-genai==2.0.8
  • pyperclip==1.9.0
  • gradio==5.9.1
  • langchain-ollama==0.2.2
  • langchain-openai==0.2.14

3. 环境变量配置

在项目根目录创建 .env 文件,配置以下环境变量:

env 复制代码
# LLM API 配置
OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=  # 可选

ANTHROPIC_API_KEY=  # 可选

GOOGLE_API_KEY= 替换为你的key # 已配置

AZURE_OPENAI_ENDPOINT=  # 可选
AZURE_OPENAI_API_KEY=  # 可选

DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=t替换为你的key # 已配置

# Chrome 配置
CHROME_PATH="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\User Data"
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
CHROME_PERSISTENT_SESSION=false  # 设置为 true 可以在 AI 任务之间保持浏览器打开

# 显示设置
RESOLUTION=1920x1080x24
RESOLUTION_WIDTH=1920
RESOLUTION_HEIGHT=1080

# VNC 设置
VNC_PASSWORD=youvncpassword

4. 启动过程中遇到的问题及解决方案

4.1 依赖问题:lxml.html.clean

问题描述

启动时遇到 ImportError:

ImportError: lxml.html.clean module is now a separate project lxml_html_clean.
Install lxml[html_clean] or lxml_html_clean directly.

解决方案

安装缺失的依赖:

bash 复制代码
pip install "lxml[html_clean]"
pip install lxml_html_clean

4.2 连接被拒绝问题

问题描述

使用默认的 127.0.0.1 地址时,无法访问 Web UI(ERR_CONNECTION_REFUSED)。

解决方案

  1. 检查服务是否正常运行:
bash 复制代码
netstat -ano | findstr :7788
  1. 使用 0.0.0.0 替代 127.0.0.1:
bash 复制代码
python webui.py --ip 0.0.0.0 --port 7788

5. 启动命令

完整的启动命令如下:

bash 复制代码
python webui.py --ip 0.0.0.0 --port 7788

6. 访问方式

服务启动后,可以通过以下方式访问:

  1. http://localhost:7788
  2. http://127.0.0.1:7788
  3. http://[本机IP]:7788

7. 故障排查建议

如果无法访问 Web UI,请检查:

  1. 确保服务正在运行
  2. 检查防火墙设置,确保端口 7788 未被阻止
  3. 如果使用代理,尝试关闭代理后访问
  4. 尝试在浏览器无痕模式下访问
  5. 查看服务日志,寻找可能的错误信息

8. 日志级别设置

.env 文件中,可以通过设置 BROWSER_USE_LOGGING_LEVEL 来调整日志级别:

  • result:仅显示结果
  • debug:显示详细调试信息
  • info:显示一般信息(默认)

9. 支持的 LLM 模型

当前配置支持以下 LLM 模型:

  1. Google Gemini(已配置)
  2. DeepSeek(已配置)
  3. OpenAI(需要配置 API key)
  4. Anthropic(需要配置 API key)
  5. Azure OpenAI(需要配置 endpoint 和 API key)

其他问题,可以参考官方文档

相关推荐
大懒猫软件6 分钟前
如何使用python技术爬取下载百度文库文档?
开发语言·python·百度
QQ_7781329747 分钟前
HarmonyOS NEXT:华为分享-碰一碰开发分享
人工智能
好想写博客7 分钟前
[深度学习]多层神经网络
人工智能·深度学习·神经网络
机器学习小小白10 分钟前
【数据挖掘实战】 房价预测
人工智能·python·机器学习·数据挖掘
深度之眼24 分钟前
ECCV 2024,全新激活函数!
人工智能·计算机视觉·激活函数
shine_du24 分钟前
Cursor 与常见集成开发环境(IDE)的优势对比
人工智能·cursor
mqiqe31 分钟前
Spring AI TikaDocumentReader
人工智能·spring·知识图谱
游客52035 分钟前
自动化办公|使用Python重命名并移动文件到对应文件夹
python·自动化
互联网时光机39 分钟前
基于Python机器学习的双色球数据分析与预测
人工智能·python·机器学习
液态不合群44 分钟前
提升大语言模型的三大策略
人工智能·深度学习·语言模型