Skyvern – AI浏览器自动化测试工具

Skyvern -- AI浏览器自动化测试工具

Skyvern是什么

Skyvern是开源的浏览器自动化工具,结合大型语言模型(LLMs)和计算机视觉技术实现复杂的网页交互和数据提取。与传统的基于DOM解析和XPath的自动化工具不同,Skyvern能实时解析网页内容,创建交互计划和执行计划,提高了自动化的灵活性和鲁棒性。Skyvern支持解决CAPTCHA、处理双因素认证、用代理网络,提供了可解释的AI功能,支持用户审查AI的每一步操作。

Skyvern的主要功能

  • CAPTCHA解决:Skyvern能自动识别、解决CAPTCHA,自动化需要人类验证的工作流程。
  • 双因素认证(2FA/MFA)支持:Skyvern支持登录需要双因素认证的用户账户,包括处理2FA和MFA代码,让自动化流程覆盖需要身份验证的场景。
  • 代理网络:Skyvern支持用代理网络,支持用户针对特定国家、州或邮政编码级别的定位,对于需要模拟特定地理位置的自动化任务非常有用。
  • 可解释的AI:Skyvern提供内置的摘要功能,支持用户检查AI执行的每一步操作,增加自动化流程的透明度和可追溯性。
  • 数据提取:Skyvern从工作流程中提取数据,支持多种数据模式,包括CSV或JSON格式,方便用户对数据进行进一步的处理和分析。

Skyvern的技术原理

  • 大型语言模型(LLMs) :Skyvern用大型语言模型理解和生成自然语言,用在理解和执行基于文本的指令,和生成描述其操作的文本。
  • 计算机视觉:Skyvern用计算机视觉技术解析和理解网页上的图像和视觉元素。能识别和操作网页上的非文本元素,如按钮、图片和图表。
  • 浏览器自动化:Skyvern基于自动化浏览器操作模拟用户行为,如点击、滚动、填写表单等。用自动化库如Playwright实现。
  • 抗布局变化:Skyvern不依赖于静态的DOM结构或XPath选择器,而是实时解析视口中的项目,能适应网页布局的变化。
  • 可解释的AI:Skyvern提供内置的摘要功能,支持用户检查AI执行的每一步操作,增加自动化流程的透明度和可追溯性。
  • 数据提取:Skyvern能从网页中提取数据,支持多种数据模式,如CSV或JSON,方便用户对数据进行进一步的处理和分析。

Skyvern的项目地址

Skyvern的产品定价

  • 开源(Open Source) :免费。访问Skyvern的GitHub页面。套餐包括基于提示的自动化、多提示工作流和可视化过去执行的功能。

  • 云(Cloud) :按页面使用付费,每页费用为0.10美元。初始充值5美元。包括防机器人措施、代理网络、验证码解决、API访问和社区支持。

  • 企业(Enterprise) :价格定制。联系Skyvern获取更多信息和定制服务。包括专业支持、复杂工作流、安全凭证、定制模型和本地托管。

Skyvern的应用场景

  • 网站数据抓取:自动化从网站提取数据,如价格、产品详情、新闻文章、股票信息等,无需手动复制粘贴。
  • 表单填写与提交:自动化填写在线表单,如注册、登录、问卷调查、订单提交等,提高效率减少人为错误。
  • 网页测试与质量保证:自动化执行网页测试,检查网站功能是否按预期工作,提高软件测试的覆盖率和准确性。
  • 竞争对手分析:自动化收集和分析竞争对手的网站信息,如价格变动、产品更新、促销活动等,制定市场策略。
  • 客户服务自动化:自动化处理客户服务任务,如自动回复常见问题、更新订单状态、收集用户反馈等。