【playwright 学习笔记】原理讲解与基础操作 --- day01

原理:

Playwright 是微软开发的 Web应用自动化测试框架

它和另外一个 web自动化框架 Selenium 有 什么区别呢?

区别一:

Selenium 只提供了 Web 自动化功能, 如果你要做自动化测试,需要结合其它自动化测试框架

而 Playwright 是面向自动化测试的,除了Web自动化功能,它也包含了自动化测试的功能框架;

安装过程跳过,直接进入基础代码

我这里使用的环境是vscode的虚拟环境、python3.14.2

基础代码:

导入playwright库:

python 复制代码
from playwright.sync_api import sync_playwright

.start()会返回一个playwright进程

python 复制代码
# 启动 playwright driver 进程
p = sync_playwright().start()
python 复制代码
# 启动浏览器,返回 Browser 类型对象
browser = p.chromium.launch(headless=False)

headless=False 取消无头模式,该模式下我们可以直接看到程序打开的浏览器

headless=True 开启无头模式,我们程序打开的浏览器被隐藏

python 复制代码
# 创建新页面,返回 Page 类型对象
page = browser.new_page()
page.goto("https://www.byhy.net/cdn2/files/selenium/stock1.html")
print(page.title()) # 打印网页标题栏

page用来接收新页面的参数,可以通过page来对新页面进行操作

python 复制代码
# 输入通讯,点击查询。这是定位与操作,是自动化重点,后文详细讲解
page.locator('#kw').fill('通讯')  # 输入通讯
page.locator('#go').click()      # 点击查询

.locator() 定位到#kw搜索框,fill() 输入通讯

python 复制代码
# 打印所有搜索内容
lcs = page.locator(".result-item").all()
for lc in lcs:
    print(lc.inner_text())
python 复制代码
# 关闭浏览器
browser.close()
python 复制代码
# 关闭 playwright driver 进程
p.stop()

完整代码和结果:

python 复制代码
from playwright.sync_api import sync_playwright

input('1....')
# 启动 playwright driver 进程
p = sync_playwright().start()

input('2....')
# 启动浏览器,返回 Browser 类型对象
browser = p.chromium.launch(headless=False)

# 创建新页面,返回 Page 类型对象
page = browser.new_page()
page.goto("https://www.byhy.net/cdn2/files/selenium/stock1.html")
print(page.title()) # 打印网页标题栏

# 输入通讯,点击查询。这是定位与操作,是自动化重点,后文详细讲解
page.locator('#kw').fill('通讯')  # 输入通讯
page.locator('#go').click()      # 点击查询

# 打印所有搜索内容
lcs = page.locator(".result-item").all()
for lc in lcs:
    print(lc.inner_text())

input('3....')
# 关闭浏览器
browser.close()
input('4....')

以上代码没有正确输出打印的结果,是因为程序来不及加载信息,我们需要给程序几秒等待的时间

界面等待:

python 复制代码
page.wait_for_timeout(2000)

加入等待时间后就正常打印出抓取的信息了:

自动化代码助手:

该助手主要记录我们对浏览器的操作,定位、文本框输入、输入网站等...

不能过彻底代替我们实现我们想要的功能,例如:无法完成数据的抓取

python 复制代码
# 运行代码
playwright codegen

跟踪功能🏷️

Playwright 有个特色功能: 跟踪(tracing)

启用跟踪功能后, 可以在执行自动化后,通过记录的跟踪数据文件, 回看自动化过程中的每个细节。

下面的的代码进行了自动化搜索股票,并打开跟踪功能,保存 跟踪数据文件 为 trace.zip

执行完以后,我们发现,当前工作目录下面多了 trace.zip 这个跟踪数据文件。

怎么查看这个跟踪文件呢?有2种方法:

  • 直接访问 trace.playwright.dev 这个网站,上传 跟踪文件

  • 执行命令 playwright show-trace trace.zip

相关推荐
西岸行者2 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
starlaky2 天前
Django入门笔记
笔记·django
勇气要爆发2 天前
吴恩达《LangChain LLM 应用开发精读笔记》1-Introduction_介绍
笔记·langchain·吴恩达
悠哉悠哉愿意2 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
勇气要爆发2 天前
吴恩达《LangChain LLM 应用开发精读笔记》2-Models, Prompts and Parsers 模型、提示和解析器
android·笔记·langchain
别催小唐敲代码2 天前
嵌入式学习路线
学习
qianshanxue112 天前
计算机操作的一些笔记标题
笔记
土拨鼠烧电路2 天前
笔记11:数据中台:不是数据仓库,是业务能力复用的引擎
数据仓库·笔记
毛小茛2 天前
计算机系统概论——校验码
学习
土拨鼠烧电路2 天前
笔记14:集成与架构:连接孤岛,构建敏捷响应能力
笔记·架构