Browser-Use WebUI项目启动指南

摘要

此前发布《Browser - Use WebUI 使用体验》博文后,鉴于部分朋友运行时出现问题,重新运行并整理相关内容。本文详细记录 Web UI 项目启动全过程,涵盖 Python 3.11+、Chrome 浏览器及 API Keys 等环境要求,Python 环境检查、依赖安装等环境配置步骤,.env 文件中环境变量的设置方法。同时,针对启动中如 lxml.html.clean 依赖缺失、连接被拒等问题给出解决方案,介绍启动命令、访问方式、故障排查建议,以及日志级别设置与支持的 LLM 模型等,还提供官方文档供参考 。

引言

之前写了一篇《Browser-Use WebUI 使用体验》的博文,有些朋友可能在运行过程中出现了一些问题,所以今天,我重新运行了一次,并对其中可能出现的问题,简单整理了一下:

Web UI 项目启动指南

本文档记录了启动 Web UI 项目的完整过程,包括环境配置、遇到的问题及其解决方案。

1. 环境要求

  • Python 3.11 或更高版本
  • Chrome 浏览器(用于浏览器自动化)
  • 相关 API Keys(支持多个 LLM 提供商)

2. 环境配置

2.1 Python 环境检查

bash 复制代码
python --version
# 输出: Python 3.11.5

2.2 安装项目依赖

bash 复制代码
pip install -r requirements.txt

依赖包括:

  • browser-use==0.1.18
  • langchain-google-genai==2.0.8
  • pyperclip==1.9.0
  • gradio==5.9.1
  • langchain-ollama==0.2.2
  • langchain-openai==0.2.14

3. 环境变量配置

在项目根目录创建 .env 文件,配置以下环境变量:

env 复制代码
# LLM API 配置
OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=  # 可选

ANTHROPIC_API_KEY=  # 可选

GOOGLE_API_KEY= 替换为你的key # 已配置

AZURE_OPENAI_ENDPOINT=  # 可选
AZURE_OPENAI_API_KEY=  # 可选

DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=t替换为你的key # 已配置

# Chrome 配置
CHROME_PATH="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\[你的用户名]\AppData\Local\Google\Chrome\User Data"
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
CHROME_PERSISTENT_SESSION=false  # 设置为 true 可以在 AI 任务之间保持浏览器打开

# 显示设置
RESOLUTION=1920x1080x24
RESOLUTION_WIDTH=1920
RESOLUTION_HEIGHT=1080

# VNC 设置
VNC_PASSWORD=youvncpassword

4. 启动过程中遇到的问题及解决方案

4.1 依赖问题:lxml.html.clean

问题描述

启动时遇到 ImportError:

复制代码
ImportError: lxml.html.clean module is now a separate project lxml_html_clean.
Install lxml[html_clean] or lxml_html_clean directly.

解决方案

安装缺失的依赖:

bash 复制代码
pip install "lxml[html_clean]"
pip install lxml_html_clean

4.2 连接被拒绝问题

问题描述

使用默认的 127.0.0.1 地址时,无法访问 Web UI(ERR_CONNECTION_REFUSED)。

解决方案

  1. 检查服务是否正常运行:
bash 复制代码
netstat -ano | findstr :7788
  1. 使用 0.0.0.0 替代 127.0.0.1:
bash 复制代码
python webui.py --ip 0.0.0.0 --port 7788

5. 启动命令

完整的启动命令如下:

bash 复制代码
python webui.py --ip 0.0.0.0 --port 7788

6. 访问方式

服务启动后,可以通过以下方式访问:

  1. http://localhost:7788
  2. http://127.0.0.1:7788
  3. http://[本机IP]:7788

7. 故障排查建议

如果无法访问 Web UI,请检查:

  1. 确保服务正在运行
  2. 检查防火墙设置,确保端口 7788 未被阻止
  3. 如果使用代理,尝试关闭代理后访问
  4. 尝试在浏览器无痕模式下访问
  5. 查看服务日志,寻找可能的错误信息

8. 日志级别设置

.env 文件中,可以通过设置 BROWSER_USE_LOGGING_LEVEL 来调整日志级别:

  • result:仅显示结果
  • debug:显示详细调试信息
  • info:显示一般信息(默认)

9. 支持的 LLM 模型

当前配置支持以下 LLM 模型:

  1. Google Gemini(已配置)
  2. DeepSeek(已配置)
  3. OpenAI(需要配置 API key)
  4. Anthropic(需要配置 API key)
  5. Azure OpenAI(需要配置 endpoint 和 API key)

其他问题,可以参考官方文档

相关推荐
站大爷IP2 分钟前
实战:爬取某联招聘职位需求并生成词云——从零开始的完整指南
python
deephub5 分钟前
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
人工智能·python·大语言模型·agent
咕白m6259 分钟前
Python 实现 PDF 页面旋转
python
算家计算13 分钟前
DeepSeek开源IMO金牌模型!跑出数学推理新高度,你的算力准备好了吗?
人工智能·资讯·deepseek
Codebee17 分钟前
SOLO+OODER全栈框架:图生代码与组件化重构实战指南
前端·人工智能
腾讯云开发者25 分钟前
AI 时代,职场不慌!前快狗打车CTO沈剑来支招
人工智能
合方圆~小文30 分钟前
球型摄像机作为现代监控系统的核心设备
java·数据库·c++·人工智能
AI_567842 分钟前
AI无人机如何让安全隐患无处遁形
人工智能·无人机
机器之心1 小时前
DeepSeek强势回归,开源IMO金牌级数学模型
人工智能·openai
机器之心1 小时前
华为放出「准万亿级MoE推理」大招,两大杀手级优化技术直接开源
人工智能·openai