【Playwright自动化】安装和使用

一、前言

Playwright 简介

Playwright 是一个由 Microsoft 开发的现代化端到端测试框架,支持 Chromium、Firefox 和 WebKit 内核的浏览器自动化。它专为测试 Web 应用设计,提供跨浏览器、跨平台(Windows、macOS、Linux)的兼容性,并支持多语言(JavaScript/TypeScript、Python、Java、.NET)。

核心特性包括:

  • 多浏览器支持:无需额外配置即可在 Chromium、Firefox 和 WebKit 上运行测试。
  • 自动等待机制:内置智能等待,减少手动添加等待时间的需求。
  • 网络拦截与模拟:可拦截和修改网络请求,模拟慢速网络或离线状态。
  • 并行测试:原生支持多线程和浏览器上下文隔离,提升测试效率。
  • 移动端模拟:通过设备描述符模拟移动设备(如 iPhone、iPad)。

Selenium 简介

Selenium 是历史悠久的 Web 自动化工具,核心由 WebDriver 协议驱动,支持多种编程语言(Python、Java、C# 等)和浏览器(需对应浏览器驱动)。

核心特性包括:

  • 广泛的浏览器支持:依赖浏览器驱动(如 ChromeDriver、GeckoDriver)。
  • 社区生态成熟:拥有大量插件和扩展(如 Selenium Grid 用于分布式测试)。
  • 灵活的集成能力:可与 TestNG、JUnit 等测试框架结合。

Playwright 与 Selenium 对比

架构与性能
  • Playwright:直接通过浏览器开发者协议(CDP)通信,无需中间驱动,启动更快。支持多浏览器上下文隔离,适合并行测试。
  • Selenium:依赖 WebDriver 协议,需单独安装浏览器驱动,启动速度较慢。并行测试需依赖 Selenium Grid。
自动化能力
  • Playwright:内置文件上传/下载、截图录屏、跨域处理等高级功能。网络拦截无需第三方库。
  • Selenium:需依赖第三方库(如 Selenium Wire)实现高级功能,基础功能需额外代码实现。
代码示例对比

Playwright(Python)

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://example.com")
    print(page.title())
    browser.close()

Selenium(Python)

python 复制代码
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")
print(driver.title)
driver.quit()
适用场景
  • 选择 Playwright:需要快速执行、跨浏览器测试或高级功能(如网络模拟)。
  • 选择 Selenium:需兼容旧项目或依赖 Selenium 生态的插件/工具。

两者均可满足 Web 自动化需求,但 Playwright 在性能、易用性和功能丰富度上更具优势,尤其适合新项目。

二、安装 Playwright for Python

确保已安装 Python(推荐 3.7 或更高版本),并通过 pip 安装 Playwright 包:

bash 复制代码
pip install playwright

安装浏览器二进制文件

Playwright 需要特定版本的浏览器(Chromium、Firefox、WebKit)支持,运行以下命令自动下载:

bash 复制代码
playwright install

验证安装

创建简单的测试脚本(例如 test_playwright.py)验证功能是否正常:

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    page = browser.new_page() # 打开一个标签页
    page.goto("https://www.baidu.com") # 打开百度地址
    print(page.title()) # 打印当前页面title
    browser.close() # 关闭浏览器对象

运行脚本:

bash 复制代码
python test_playwright.py

若输出网页标题(如 "百度一下,你就知道"),则安装成功。

可选:异步 API

Playwright 支持异步操作,适用于异步框架(如 asyncio):

python 复制代码
import asyncio
from playwright.async_api import async_playwright


async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())

三、headless 模式

headless 模式指无图形用户界面(GUI)的运行方式,通常用于浏览器、应用程序或操作系统。该模式通过命令行或脚本操作,适用于自动化测试、服务器环境或资源受限的场景。

headless 模式的应用场景

  • 自动化测试:调用 headless 浏览器执行网页测试。
  • 爬虫开发:无界面浏览器可模拟用户操作,绕过反爬机制。
  • 服务器环境:在无显示设备的服务器上运行需要浏览器支持的工具(如 PDF 生成)。

headless 模式的优缺点

优点

  • 节省系统资源,无需渲染图形界面。
  • 支持脚本化操作,易于集成到 CI/CD 流程。

缺点

  • 部分依赖 GUI 交互的功能无法使用(如手势操作)。
  • 调试复杂,需依赖日志或远程调试端口。

基本无头浏览器启动

使用playwright.sync_api模块同步模式启动无头浏览器(以Chromium为例):

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)  # 无头模式
    page = browser.new_page()
    page.goto("https://www.baidu.com")
    print(page.title())
    browser.close()

异步模式示例

异步接口更适合高性能爬虫或自动化任务:

python 复制代码
import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())
相关推荐
m0_748554817 小时前
golang如何实现用户订阅偏好管理_golang用户订阅偏好管理实现总结
jvm·数据库·python
smj2302_796826527 小时前
解决leetcode第3911题.移除子数组元素后第k小偶数
数据结构·python·算法·leetcode
阿正呀8 小时前
Redis怎样实现本地缓存的高效失效通知
jvm·数据库·python
九转成圣8 小时前
Java 性能优化实战:如何将海量扁平数据高效转化为类目字典树?
java·开发语言·json
SmartRadio8 小时前
ESP32-S3 双模式切换实现:兼顾手机_路由器连接与WiFi长距离通信
开发语言·网络·智能手机·esp32·长距离wifi
2501_901200538 小时前
mysql如何设置InnoDB引擎参数_优化innodb_buffer_pool
jvm·数据库·python
laowangpython8 小时前
Rust 入门:GitHub 热门内存安全编程语言
开发语言·其他·rust·github
我叫汪枫8 小时前
在后台管理系统中,如何递归和选择保留的思路来过滤菜单
开发语言·javascript·node.js·ecmascript
_.Switch8 小时前
东方财富股票数据JS逆向:secids字段和AES加密实战
开发语言·前端·javascript·网络·爬虫·python·ecmascript
软件技术NINI8 小时前
webkit简介及工作流程
开发语言·前端·javascript·udp·ecmascript·webkit·yarn