开源一个Browser-Use的UI小工具
Browser-Use 是一个开源的网页自动化库,它通过提供一个简单的接口,让 LLM 能够与网站进行互动。这个库支持多标签管理、XPath 提取和视觉模型处理,使得自动化网页操作变得更加简单和高效。支持所有 LangChain 聊天模型,包括但不限于 GPT-4o、GPT-4o Mini、Claude 3.5 Sonnet 和 LLama 3.1 405B。这些模型都是当前领先的大型语言模型,能够处理各种复杂的语言相关任务。
最近Browser-Use这个开源项目特别火,现在已经有12K多的star了,但是使用它需要配置Python环境,下载各种依赖,还需要写Python代码,对于一些没有代码基础的用户稍微复杂了一些,所以我写了一个UI工具,并在把Python环境内置打包进去了,安装之后,配置一下模型参数即可使用,即使是不懂代码的小白用户也可以体验这款AI产品了。
1. 软件下载安装
项目的开源地址:github.com/knowwhythat... 下载完成之后直接双击安装包即可,安装完成之后点击快捷方式,就能看到如下的界面了。
2. 配置模型参数
Browser-Use 支持的模型众多,对于国内的用户,推荐使用deepseek模型,该模型速度快,注册即送500万 token,足够我们测试使用,且注册简单。 浏览器访问官网:www.deepseek.com/,点击接入API,使用... Keys,然后点击创建API Key,随便输入一个名称点击创建,注意这里要把apiKey复制保存一下。
创建完apiKey之后,回到我们的GobotAgent软件,点击左下角的设置按钮,在设置弹窗中填写信息如下: API_BASE_URL:api.deepseek.com API_KEY:填写你刚才复制的key 模型名称:deepseek-chat 浏览器路径,可以点击输入框右侧的按钮,然后选择自己的chrome浏览器的可执行文件(.exe)所在的路径,也可以不设置。 完成上述设置之后,点击保存,之后就可以使用了。