【playwright 学习笔记】原理讲解与基础操作 --- day01

原理:

Playwright 是微软开发的 Web应用自动化测试框架

它和另外一个 web自动化框架 Selenium 有 什么区别呢?

区别一:

Selenium 只提供了 Web 自动化功能, 如果你要做自动化测试,需要结合其它自动化测试框架

而 Playwright 是面向自动化测试的,除了Web自动化功能,它也包含了自动化测试的功能框架;

安装过程跳过,直接进入基础代码

我这里使用的环境是vscode的虚拟环境、python3.14.2

基础代码:

导入playwright库:

python 复制代码
from playwright.sync_api import sync_playwright

.start()会返回一个playwright进程

python 复制代码
# 启动 playwright driver 进程
p = sync_playwright().start()
python 复制代码
# 启动浏览器,返回 Browser 类型对象
browser = p.chromium.launch(headless=False)

headless=False 取消无头模式,该模式下我们可以直接看到程序打开的浏览器

headless=True 开启无头模式,我们程序打开的浏览器被隐藏

python 复制代码
# 创建新页面,返回 Page 类型对象
page = browser.new_page()
page.goto("https://www.byhy.net/cdn2/files/selenium/stock1.html")
print(page.title()) # 打印网页标题栏

page用来接收新页面的参数,可以通过page来对新页面进行操作

python 复制代码
# 输入通讯,点击查询。这是定位与操作,是自动化重点,后文详细讲解
page.locator('#kw').fill('通讯')  # 输入通讯
page.locator('#go').click()      # 点击查询

.locator() 定位到#kw搜索框,fill() 输入通讯

python 复制代码
# 打印所有搜索内容
lcs = page.locator(".result-item").all()
for lc in lcs:
    print(lc.inner_text())
python 复制代码
# 关闭浏览器
browser.close()
python 复制代码
# 关闭 playwright driver 进程
p.stop()

完整代码和结果:

python 复制代码
from playwright.sync_api import sync_playwright

input('1....')
# 启动 playwright driver 进程
p = sync_playwright().start()

input('2....')
# 启动浏览器,返回 Browser 类型对象
browser = p.chromium.launch(headless=False)

# 创建新页面,返回 Page 类型对象
page = browser.new_page()
page.goto("https://www.byhy.net/cdn2/files/selenium/stock1.html")
print(page.title()) # 打印网页标题栏

# 输入通讯,点击查询。这是定位与操作,是自动化重点,后文详细讲解
page.locator('#kw').fill('通讯')  # 输入通讯
page.locator('#go').click()      # 点击查询

# 打印所有搜索内容
lcs = page.locator(".result-item").all()
for lc in lcs:
    print(lc.inner_text())

input('3....')
# 关闭浏览器
browser.close()
input('4....')

以上代码没有正确输出打印的结果,是因为程序来不及加载信息,我们需要给程序几秒等待的时间

界面等待:

python 复制代码
page.wait_for_timeout(2000)

加入等待时间后就正常打印出抓取的信息了:

自动化代码助手:

该助手主要记录我们对浏览器的操作,定位、文本框输入、输入网站等...

不能过彻底代替我们实现我们想要的功能,例如:无法完成数据的抓取

python 复制代码
# 运行代码
playwright codegen

跟踪功能🏷️

Playwright 有个特色功能: 跟踪(tracing)

启用跟踪功能后, 可以在执行自动化后,通过记录的跟踪数据文件, 回看自动化过程中的每个细节。

下面的的代码进行了自动化搜索股票,并打开跟踪功能,保存 跟踪数据文件 为 trace.zip

执行完以后,我们发现,当前工作目录下面多了 trace.zip 这个跟踪数据文件。

怎么查看这个跟踪文件呢?有2种方法:

  • 直接访问 trace.playwright.dev 这个网站,上传 跟踪文件

  • 执行命令 playwright show-trace trace.zip

相关推荐
做cv的小昊12 分钟前
【TJU】应用统计学——第五周作业(3.1 假设检验的基本思想、3.2 单个正态总体参数的假设检验)
学习·线性代数·机器学习·数学建模·矩阵·概率论·tju
格鸰爱童话40 分钟前
向AI学习项目技能(六)
java·人工智能·spring boot·python·学习
H_老邪1 小时前
spring boot 学习之路-1.0
spring boot·后端·学习
东京老树根1 小时前
SAP学习笔记 - BTP SAP Build02 - Deploy,开始URL,Approve,Reject,履历确认,Log,Context
笔记·学习
zjeweler1 小时前
“网安+护网”终极300多问题面试笔记-全
笔记·网络安全·面试·职场和发展
仲芒1 小时前
[24年单独笔记] MySQL 常用的 DDL 命令
笔记·mysql·oracle
头疼的程序员2 小时前
计算机网络:自顶向下方法(第七版)第九章 学习分享(一)
学习·计算机网络
小墨同学boy2 小时前
越用越强不是广告语:拆解 Hermes Agent 的三层学习机制
人工智能·学习
仲芒3 小时前
[24年单独笔记] MySQL 常用的 DML 命令
数据库·笔记·mysql
lwewan3 小时前
CPU 调度
笔记·考研