DrissionPage自动化

前言

本文主要介绍了DrissionPage的基本用法,需要详细了解的可以查看DP官网。
DrissionPage官方文档:https://www.drissionpage.cn/browser_control/intro

基本逻辑如下:

  1. 创建浏览器对象,用于启动或接管浏览器(打开浏览器)
  2. 获取一个 Tab 对象
  3. 使用 Tab 对象访问网址
  4. 使用 Tab 对象获取标签页内需要的元素对象
  5. 使用元素对象进行交互

除此以外,还能执行更为复杂的操作,如执行 js 代码、监听网络数据、下载文件等。

使用DrissionPage之前需要安装这个第三方库:

cmd 复制代码
pip install DrissionPage
python 复制代码
from Drission import Chromium

# 1. 创建浏览器对象
browser = Chromium()

# 2. 获取一个最新 Tab(标签页)对象
tab = browser.latest_tab

# 3. 使用tab对象访问网址
tab.get("https://www.baidu.com")

# 4. 使用tab对象获取标签页内需要的元素对象
# 根据CSS选择器获取元素
ele = tab.ele("#kw")

# 5. 使用元素对象进行交互
# 向文本框元素输入对象输入文本
ele.input("python")

# 6. 获取点击按钮元素
btn_ele = tab.ele('#su')
# 7. 元素点击(通过js点击)
btn_ele.click(by_js=True)

# ----------------------------------------
# 也可以使用tab对象直接添加选择器的方式调用元素对象方法,因为会自动调用获取元素ele方法
tab("#kw").input('python')  # 内部自动调用了ele方法

✅️️ 浏览器对象

Chromium对象,用于管理浏览器整体相关的操作。

如标签页管理、获取浏览器信息、设置整体运行参数等。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()  # 创建浏览器对象
browser.set.retry_times(10)  # 设置整体运行参数
tab = browser.latest_tab  # 获取Tab对象
browser.quit()  # 关闭浏览器

✅️️ 标签页对象

Tab 对象从浏览器对象获取,每个 Tab 对象对应浏览器上一个实际的标签页。

大部分操作都使用 Tab 对象进行,如访问网站、调整窗口大小、监听网络等。

默认情况下每个标签页只有一个 Tab 对象,关闭单例模式后可用多个 Tab 对象同时控制一个标签页。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()
tab1 = browser.latest_tab  # 获取最后激活的标签页对象
tab1.get('http://DrissionPage.cn')  # 标签页访问一个网址
tab2 = browser.new_tab('https://www.baidu.com')  # 新建一个标签页并访问网址
tab3 = browser.get_tab(title='DrissionPage')  # 按条件获取标签页对象

自动化中的xpath

python 复制代码
ele = tab.ele('xpath://input[@id="kw"]')

文本定位

文本值需要是唯一的,否则会发生错乱,不能精准定位。

python 复制代码
ele = tab.ele('text:登录')

获取文本和属性值

python 复制代码
ele_a = tab.ele('xpath://*[@id="s-top-left"]/a')

for i in ele_a:
    text = i.text   # 获取文本内容
    attr_value = i.attrs['href']  # 获取属性值
相关推荐
深蓝海拓2 分钟前
PySide6从0开始学习的笔记(八) 控件(Widget)之QSlider(滑动条)
笔记·python·qt·学习·pyqt
dazzle5 分钟前
《DataFrame可视化与高级方法》
python·pandas
Blossom.1188 分钟前
Transformer时序预测实战:用PyTorch构建股价预测模型
运维·人工智能·pytorch·python·深度学习·自动化·transformer
我命由我123458 分钟前
Python Flask 开发问题:ImportError: cannot import name ‘escape‘ from ‘flask‘
服务器·开发语言·后端·python·flask·学习方法·python3.11
baby_hua10 分钟前
20251031_三天速通PyTorch
人工智能·pytorch·python
weixin_4046793113 分钟前
pytorch nn.Parameter self.register_parameter() 区别
人工智能·pytorch·python·深度学习·机器学习
idkmn_17 分钟前
Agentic AI 基础概念
人工智能·python·深度学习·chatgpt·langchain
有味道的男人19 分钟前
淘宝图片搜索(拍立淘)+ 店铺全商品爬虫 深度实战指南(Python)
开发语言·爬虫·python
JHC00000025 分钟前
119. 杨辉三角 II
python·算法·面试
加成BUFF29 分钟前
树莓派5控制WS2812 RGB灯带:原理、接线与实战指南
python·嵌入式硬件·远程连接·ws2812·树莓派5