DrissionPage自动化

前言

本文主要介绍了DrissionPage的基本用法,需要详细了解的可以查看DP官网。
DrissionPage官方文档:https://www.drissionpage.cn/browser_control/intro

基本逻辑如下:

  1. 创建浏览器对象,用于启动或接管浏览器(打开浏览器)
  2. 获取一个 Tab 对象
  3. 使用 Tab 对象访问网址
  4. 使用 Tab 对象获取标签页内需要的元素对象
  5. 使用元素对象进行交互

除此以外,还能执行更为复杂的操作,如执行 js 代码、监听网络数据、下载文件等。

使用DrissionPage之前需要安装这个第三方库:

cmd 复制代码
pip install DrissionPage
python 复制代码
from Drission import Chromium

# 1. 创建浏览器对象
browser = Chromium()

# 2. 获取一个最新 Tab(标签页)对象
tab = browser.latest_tab

# 3. 使用tab对象访问网址
tab.get("https://www.baidu.com")

# 4. 使用tab对象获取标签页内需要的元素对象
# 根据CSS选择器获取元素
ele = tab.ele("#kw")

# 5. 使用元素对象进行交互
# 向文本框元素输入对象输入文本
ele.input("python")

# 6. 获取点击按钮元素
btn_ele = tab.ele('#su')
# 7. 元素点击(通过js点击)
btn_ele.click(by_js=True)

# ----------------------------------------
# 也可以使用tab对象直接添加选择器的方式调用元素对象方法,因为会自动调用获取元素ele方法
tab("#kw").input('python')  # 内部自动调用了ele方法

✅️️ 浏览器对象

Chromium对象,用于管理浏览器整体相关的操作。

如标签页管理、获取浏览器信息、设置整体运行参数等。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()  # 创建浏览器对象
browser.set.retry_times(10)  # 设置整体运行参数
tab = browser.latest_tab  # 获取Tab对象
browser.quit()  # 关闭浏览器

✅️️ 标签页对象

Tab 对象从浏览器对象获取,每个 Tab 对象对应浏览器上一个实际的标签页。

大部分操作都使用 Tab 对象进行,如访问网站、调整窗口大小、监听网络等。

默认情况下每个标签页只有一个 Tab 对象,关闭单例模式后可用多个 Tab 对象同时控制一个标签页。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()
tab1 = browser.latest_tab  # 获取最后激活的标签页对象
tab1.get('http://DrissionPage.cn')  # 标签页访问一个网址
tab2 = browser.new_tab('https://www.baidu.com')  # 新建一个标签页并访问网址
tab3 = browser.get_tab(title='DrissionPage')  # 按条件获取标签页对象

自动化中的xpath

python 复制代码
ele = tab.ele('xpath://input[@id="kw"]')

文本定位

文本值需要是唯一的,否则会发生错乱,不能精准定位。

python 复制代码
ele = tab.ele('text:登录')

获取文本和属性值

python 复制代码
ele_a = tab.ele('xpath://*[@id="s-top-left"]/a')

for i in ele_a:
    text = i.text   # 获取文本内容
    attr_value = i.attrs['href']  # 获取属性值
相关推荐
SiYuanFeng3 小时前
Colab复现 NanoChat:从 Tokenizer(CPU)、Base Train(CPU) 到 SFT(GPU) 的完整踩坑实录
python·colab
炸炸鱼.3 小时前
Python 操作 MySQL 数据库
android·数据库·python·adb
_深海凉_4 小时前
LeetCode热题100-颜色分类
python·算法·leetcode
AC赳赳老秦4 小时前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
大强同学5 小时前
Obsidian 日记:从模板到 Dataview 自动化
运维·自动化
zhaoshuzhaoshu5 小时前
Python 语法之数据结构详细解析
python
AI问答工程师5 小时前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
zfan5206 小时前
python对Excel数据处理(1)
python·excel·pandas
小饕6 小时前
我从零搭建 RAG 学到的 10 件事
python
老歌老听老掉牙6 小时前
PyQt5+Qt Designer实战:可视化设计智能参数配置界面,告别手动布局时代!
python·qt