Playwright 快速入门:Playwright 是一个用于浏览器自动化测试的 Node.js 库

Playwright 是一个用于浏览器自动化测试的 Node.js 库,它支持 Chromium, Firefox 和 WebKit 浏览器引擎。Playwright 提供了一套强大的 API 来进行网页自动化测试,包括页面导航、元素选择、表单提交等操作,并且能够处理现代网页中的异步加载内容。

下面是一个简单的入门案例,展示如何使用 Playwright 进行基本的网页浏览和元素交互。这个例子将打开浏览器,访问一个网站,查找特定的文本并关闭浏览器。

官方文档:https://playwright.nodejs.cn/

安装 Playwright

首先,你需要安装 Playwright。如果你还没有安装 Node.js,请先安装 Node.js,然后在你的项目文件夹中初始化一个新的 Node.js 项目,并安装 Playwright。

bash 复制代码
npm init -y
npm init playwright@latest

编写第一个测试脚本

创建一个名为 test.js 的文件,并添加以下代码:

javascript 复制代码
const { test, expect } = require('@playwright/test');

test('basic test', async ({ page }) => {
  // 打开目标网站
  await page.goto('https://example.com');

  // 查找页面上的某个元素,并验证其文本内容
  await expect(page).toHaveTitle('Example Domain');
  const heading = await page.locator('h1');
  await expect(heading).toHaveText('Example Domain');

  // 截图保存
  await page.screenshot({ path: 'example.png' });

  // 关闭浏览器(可选)
  // await browser.close();
});

运行测试脚本

在命令行中运行测试脚本:

bash 复制代码
npx playwright test test.js

解释

  • test('basic test', async ({ page }) => { ... }): 定义了一个测试用例,其中 page 是一个浏览器页面对象,允许你与页面进行交互。
  • await page.goto('https://example.com'): 导航到指定的 URL。
  • await expect(page).toHaveTitle('Example Domain'): 断言页面标题是否为预期值。
  • const heading = await page.locator('h1'): 使用 CSS 选择器定位页面上的 <h1> 标签。
  • await expect(heading).toHaveText('Example Domain'): 检查找到的元素是否包含预期的文本。
  • await page.screenshot({ path: 'example.png' }): 对当前页面截图,并保存为 example.png 文件。

以上就是使用 Playwright 进行基本的网页自动化测试的一个简单示例。通过修改页面地址和断言条件,你可以针对不同的网站和功能编写更复杂的测试用例。

案例:打开百度并搜索

java 复制代码
const { chromium } = require('playwright');

(async () => {
    // 启动带有用户数据目录的Chromium浏览器
    const browserContext = await chromium.launchPersistentContext('C:\\Users\\ZHENG\\AppData\\Local\\Google\\Chrome\\User Data', {
        headless: false, // 显示浏览器窗口
    });
    // 获取默认页面
    const page = browserContext.pages()[0];
    // 防止被检测到是自动化工具
    const js = "Object.defineProperties(navigator, {webdriver:{get:()=>undefined}});";
    await page.addInitScript(js);

    // 访问百度首页
    await page.goto('https://www.baidu.com');

    // 在搜索框中输入"智能手机" //*[@id="kw"]
    await page.fill('input[name="wd"]', '智能手机');

    // 提交表单
    await page.press('input[name="wd"]', 'Enter');

    // 等待搜索结果加载完成
    await page.waitForSelector('.c-container'); // 百度搜索结果中的一个通用选择器

    // 获取所有搜索结果的链接
    const searchResultLinks = await page.$$eval('content_left a', links => links.map(link => link.href));

    // 遍历每个链接,进入链接并获取指定XPath的数据
    for (let url of searchResultLinks) {
        try {
            // 进入每个搜索结果页面
            await page.goto(url);

            // 假设我们要抓取页面中所有段落的文字内容,XPath为 '//p'
            const paragraphTexts = await page.$$eval('//p', paragraphs => paragraphs.map(p => p.textContent.trim()));

            // 输出抓取的内容
            console.log(`从页面 ${url} 抓取到的内容:`, paragraphTexts.join('\n'));
        } catch (error) {
            console.error(`访问或抓取页面 ${url} 时出错:`, error.message);
        }
    }

    // 当所有操作完成后,关闭浏览器上下文
    await browserContext.close();
})();
相关推荐
昨天今天明天好多天1 小时前
【Node.js]
前端·node.js
熊的猫1 小时前
DOM 规范 — MutationObserver 接口
前端·javascript·chrome·webpack·前端框架·node.js·ecmascript
爱编程的鱼4 小时前
Node.js事件循环:解锁异步编程的奥秘
node.js
南暮思鸢4 小时前
Node.js is Web Scale
经验分享·web安全·网络安全·node.js·ctf题目·hackergame 2024
Martin -Tang5 小时前
vite和webpack的区别
前端·webpack·node.js·vite
王解6 小时前
webpack loader全解析,从入门到精通(10)
前端·webpack·node.js
ldq_sd16 小时前
node.js安装和配置教程
node.js
我真的很困17 小时前
坤坤带你学浏览器缓存
前端·http·node.js
whyfail20 小时前
ESM 与 CommonJS:JavaScript 模块化的两大主流方式
javascript·node.js