playwright学习

1、概述

微软开发,基于Devtools协议的浏览器自动化工具,支持浏览器Chrome、Edge、Firefox、WebKit(Safari 内核)。支持多种语言,Node.js、TypeScript/JavaScript、Python、.NET、Java。

官网:https://playwright.dev/

2、使用

1、环境准备

安装库:pip install playwright

安装浏览器:playwright install

Playwright自动安装到系统用户目录,浏览器也会下载到这个目录,比如:

C:\Users\你的用户名\AppData\Local\ms-playwright\

playwright install会安装所有浏览器,若要安装指定浏览器,可使用如下命令:

python 复制代码
# 只装 Chrome/Edge
playwright install chromium

# 只装火狐
playwright install firefox

# 只装 Safari 内核
playwright install webkit

2、playwright自动录制功能

在浏览器上的操作,会自动生成完整的Python、JS代码,直接复制就能用。

命令格式如下,

playwright codegen 网址,比如:playwright codegen https://www.baidu.com/

运行命令会出现2个窗口,一个是浏览器窗口,一个是Playwright Inspector窗口,

手动在浏览器窗口上,Playwright Inspector窗口自动生成代码。

3、语言切换

Playwright Inspector窗口支持自带语言切换功能,切换后已录制的代码会自动转换成新语言。

4、示例

1、打开网页

2、输入"NBA"

3、点击"百度一下"按钮
可以用自动录制功能生成代码,也需要F12打开浏览器调试窗口查看元素信息,手动调整代码,

也可以纯手动编码。

python 复制代码
import time
from playwright.sync_api import Playwright, sync_playwright, expect


def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = browser.new_page()
    page.goto("https://www.baidu.com")
    page.locator("#chat-textarea").click()
    page.locator("#chat-textarea").fill("NBA")
    page.get_by_role("button", name="百度一下").click()

    # 延时为了看效果
    time.sleep(10)

    context.close()
    browser.close()


with sync_playwright() as playwright:
    run(playwright)

5、一些常用命令

页面导航

goto:直接跳转

reload:刷新

go_back:后退

go_foaward:前进

页面状态

page.url:获取当前页面url

page.title:获取当前页面的标题

page.content:获取完整的页面html内容

页面动作

page.set_viewport_size:设置页面的视口大小,用于模拟不同的设备屏幕,如桌面、平板、手机

page.screenshot:捕获当前页面的截图

page.evaluate:在页面上下文中执行一段JavaScript表达式并返回结果

page.wait_for_url:等待页面的url变为指定的值或满足特定模式,常用于验证重定向或表单提交后的页面跳转

page.wait_for_timeout:强制暂停指定毫秒数,仅应用于调试场景,在正式测试代码中,应避免使用,因为它会引入不必要的延迟和不稳定性。

元素定位

page.locator("css选择器")

page.get_by_text("文字"):通过文本内容进行元素定位

page.get_by_role("角色", name="名称")

page.get_by_placeholder("提示文字"):通过placeholder属性定位元素

page.get_by_title:通过title属性定位元素

page.get_by_alt_text:通过alt属性定位元素,通常是图像

page.locator("#id")

应该还有很多高级功能,暂时没研究那么多

相关推荐
哥布林学者4 小时前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai
岳小哥AI13 小时前
AI大模型"幻觉"从何而来?解密GPT-4、DeepSeek一本正经胡说八道的真相
ai·ai基础
JaguarJack1 天前
Openai Codex 重大更新 已支持接入任意开源大模型
ai·openai·codex
Artech1 天前
[MAF预定义的AIContextProvider-02]AgentSkillsProvider——将Agent Skills引入MAF
ai·c#·agent·agent skills·maf
岳小哥AI2 天前
读懂计算机视觉CV、语言感知(ASR/TTS)、多模态,就能理解AI是如何“看到”与“听到”世界的
ai·ai基础
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
通信小呆呆2 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
施小赞2 天前
普通 RAG vs GraphRAG 核心对比
人工智能·ai
H__Rick2 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee2 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale