WebLlama:通过对话进行网页浏览的智能代理

WebLlama:智能网页浏览代理

WebLlama 是 McGill University 自然语言处理团队的研究项目,旨在开发能通过对话浏览网页的智能代理。这些代理基于 Llama-3 模型优化微调,基于 Llama-3-8B-Instruct 模型,专为网页导航和对话任务优化,可有效处理复杂的网页交互任务。

WebLlama 性能优于 GPT-4V,尤其在真实世界的网页浏览相关任务上。微调使用 WebLINX 数据集,包含超 10 万网页导航和对话实例,由专家注释人员收集验证。为训练模型,选取了 2.4 万精选子集,确保训练质量和代理实用性。

该模型已在 Hugging Face Model Hub 上发布,名称为 McGill-NLP/Llama-3-8B-Web。同时,训练和评估数据也可在 Huggingface Hub 上找到,数据集名称为 McGill-NLP/WebLINX。

主要功能

WebLlama 能处理连续对话,用户可通过多轮交流提供指令并获取反馈。代理可与现代网页自动化框架集成,在实际浏览器环境中执行动作,如点击、滚动、填写表单等。

WebLlama 具备以下功能:

自动网页浏览:根据用户指令自动浏览网页,执行搜索、导航和信息检索等任务。

交互对话:通过自然语言与用户交互,理解指令并提供反馈。

执行网页操作:点击链接、填写和提交表单等。

自动任务完成:按用户指令完成特定任务,如预订酒店、购物或查找信息。

WebLlama 为网页交互带来新方式,将为生活和工作提供更多便利。

相关推荐
猫头虎11 小时前
昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地
人工智能·百度·开源·aigc·文心一言·gpu算力·agi
极客密码14 小时前
充了20刀 Cursor Pro 的朋友看到我的方案沉默了...
aigc·ai编程·cursor
后端小肥肠17 小时前
10W+育儿漫画是怎么做的?我用n8n搭建了自动化工作流,3分钟生成到本地磁盘
人工智能·aigc·agent
司马阅-SmartRead18 小时前
司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型
人工智能·aigc
Mintopia1 天前
🤖 通用人工智能(AGI)离 Web 应用还有多远?
前端·javascript·aigc
墨风如雪1 天前
360 FG-CLIP2:让AI拥有“火眼金睛”,刷新全球图文理解上限
aigc
用户5191495848452 天前
原型污染攻击工具揭秘:Prototype Pollution Gadgets Finder
人工智能·aigc
安思派Anspire2 天前
构建一个自主深度思考的RAG管道以解决复杂查询--通过网络搜索扩充知识(6)
aigc·openai·agent
ZEGO即构开发者2 天前
【ZEGO即构开发者日报】Soul AI Lab开源播客语音合成模型;腾讯混元推出国内首个交互式AI播客;ChatGPT Go向用户免费开放一年......
人工智能·aigc·语音识别·实时音视频
Baihai_IDP2 天前
怎样为你的 RAG 应用选择合适的嵌入模型?
人工智能·llm·aigc