【Playwright自动化】安装和使用

一、前言

Playwright 简介

Playwright 是一个由 Microsoft 开发的现代化端到端测试框架,支持 Chromium、Firefox 和 WebKit 内核的浏览器自动化。它专为测试 Web 应用设计,提供跨浏览器、跨平台(Windows、macOS、Linux)的兼容性,并支持多语言(JavaScript/TypeScript、Python、Java、.NET)。

核心特性包括:

  • 多浏览器支持:无需额外配置即可在 Chromium、Firefox 和 WebKit 上运行测试。
  • 自动等待机制:内置智能等待,减少手动添加等待时间的需求。
  • 网络拦截与模拟:可拦截和修改网络请求,模拟慢速网络或离线状态。
  • 并行测试:原生支持多线程和浏览器上下文隔离,提升测试效率。
  • 移动端模拟:通过设备描述符模拟移动设备(如 iPhone、iPad)。

Selenium 简介

Selenium 是历史悠久的 Web 自动化工具,核心由 WebDriver 协议驱动,支持多种编程语言(Python、Java、C# 等)和浏览器(需对应浏览器驱动)。

核心特性包括:

  • 广泛的浏览器支持:依赖浏览器驱动(如 ChromeDriver、GeckoDriver)。
  • 社区生态成熟:拥有大量插件和扩展(如 Selenium Grid 用于分布式测试)。
  • 灵活的集成能力:可与 TestNG、JUnit 等测试框架结合。

Playwright 与 Selenium 对比

架构与性能
  • Playwright:直接通过浏览器开发者协议(CDP)通信,无需中间驱动,启动更快。支持多浏览器上下文隔离,适合并行测试。
  • Selenium:依赖 WebDriver 协议,需单独安装浏览器驱动,启动速度较慢。并行测试需依赖 Selenium Grid。
自动化能力
  • Playwright:内置文件上传/下载、截图录屏、跨域处理等高级功能。网络拦截无需第三方库。
  • Selenium:需依赖第三方库(如 Selenium Wire)实现高级功能,基础功能需额外代码实现。
代码示例对比

Playwright(Python)

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch()
    page = browser.new_page()
    page.goto("https://example.com")
    print(page.title())
    browser.close()

Selenium(Python)

python 复制代码
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")
print(driver.title)
driver.quit()
适用场景
  • 选择 Playwright:需要快速执行、跨浏览器测试或高级功能(如网络模拟)。
  • 选择 Selenium:需兼容旧项目或依赖 Selenium 生态的插件/工具。

两者均可满足 Web 自动化需求,但 Playwright 在性能、易用性和功能丰富度上更具优势,尤其适合新项目。

二、安装 Playwright for Python

确保已安装 Python(推荐 3.7 或更高版本),并通过 pip 安装 Playwright 包:

bash 复制代码
pip install playwright

安装浏览器二进制文件

Playwright 需要特定版本的浏览器(Chromium、Firefox、WebKit)支持,运行以下命令自动下载:

bash 复制代码
playwright install

验证安装

创建简单的测试脚本(例如 test_playwright.py)验证功能是否正常:

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    page = browser.new_page() # 打开一个标签页
    page.goto("https://www.baidu.com") # 打开百度地址
    print(page.title()) # 打印当前页面title
    browser.close() # 关闭浏览器对象

运行脚本:

bash 复制代码
python test_playwright.py

若输出网页标题(如 "百度一下,你就知道"),则安装成功。

可选:异步 API

Playwright 支持异步操作,适用于异步框架(如 asyncio):

python 复制代码
import asyncio
from playwright.async_api import async_playwright


async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())

三、headless 模式

headless 模式指无图形用户界面(GUI)的运行方式,通常用于浏览器、应用程序或操作系统。该模式通过命令行或脚本操作,适用于自动化测试、服务器环境或资源受限的场景。

headless 模式的应用场景

  • 自动化测试:调用 headless 浏览器执行网页测试。
  • 爬虫开发:无界面浏览器可模拟用户操作,绕过反爬机制。
  • 服务器环境:在无显示设备的服务器上运行需要浏览器支持的工具(如 PDF 生成)。

headless 模式的优缺点

优点

  • 节省系统资源,无需渲染图形界面。
  • 支持脚本化操作,易于集成到 CI/CD 流程。

缺点

  • 部分依赖 GUI 交互的功能无法使用(如手势操作)。
  • 调试复杂,需依赖日志或远程调试端口。

基本无头浏览器启动

使用playwright.sync_api模块同步模式启动无头浏览器(以Chromium为例):

python 复制代码
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)  # 无头模式
    page = browser.new_page()
    page.goto("https://www.baidu.com")
    print(page.title())
    browser.close()

异步模式示例

异步接口更适合高性能爬虫或自动化任务:

python 复制代码
import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        await page.goto("https://www.baidu.com")
        print(await page.title())
        await browser.close()

asyncio.run(main())
相关推荐
听风吟丶2 小时前
Java NIO 深度解析:从 BIO 到 NIO 的演进与实战
开发语言·python
学历真的很重要2 小时前
LangChain V1.0 Messages 详细指南
开发语言·后端·语言模型·面试·langchain·职场发展·langgraph
sali-tec2 小时前
C# 基于halcon的视觉工作流-章58-输出点云图
开发语言·人工智能·算法·计算机视觉·c#
lpfasd1232 小时前
Rust + WebAssembly:让嵌入式设备被浏览器调试
开发语言·rust·wasm
lion King7762 小时前
c++八股:explicit
开发语言·c++
初见无风2 小时前
4.3 Boost 库工具类 optional 的使用
开发语言·c++·boost
yuxb732 小时前
Python基础(一)
笔记·python
QiZhang | UESTC2 小时前
JAVA算法练习题day67
java·python·学习·算法·leetcode
有梦想的攻城狮2 小时前
我与C++的一面之缘
开发语言·c++