DrissionPage自动化

前言

本文主要介绍了DrissionPage的基本用法,需要详细了解的可以查看DP官网。
DrissionPage官方文档:https://www.drissionpage.cn/browser_control/intro

基本逻辑如下:

  1. 创建浏览器对象,用于启动或接管浏览器(打开浏览器)
  2. 获取一个 Tab 对象
  3. 使用 Tab 对象访问网址
  4. 使用 Tab 对象获取标签页内需要的元素对象
  5. 使用元素对象进行交互

除此以外,还能执行更为复杂的操作,如执行 js 代码、监听网络数据、下载文件等。

使用DrissionPage之前需要安装这个第三方库:

cmd 复制代码
pip install DrissionPage
python 复制代码
from Drission import Chromium

# 1. 创建浏览器对象
browser = Chromium()

# 2. 获取一个最新 Tab(标签页)对象
tab = browser.latest_tab

# 3. 使用tab对象访问网址
tab.get("https://www.baidu.com")

# 4. 使用tab对象获取标签页内需要的元素对象
# 根据CSS选择器获取元素
ele = tab.ele("#kw")

# 5. 使用元素对象进行交互
# 向文本框元素输入对象输入文本
ele.input("python")

# 6. 获取点击按钮元素
btn_ele = tab.ele('#su')
# 7. 元素点击(通过js点击)
btn_ele.click(by_js=True)

# ----------------------------------------
# 也可以使用tab对象直接添加选择器的方式调用元素对象方法,因为会自动调用获取元素ele方法
tab("#kw").input('python')  # 内部自动调用了ele方法

✅️️ 浏览器对象

Chromium对象,用于管理浏览器整体相关的操作。

如标签页管理、获取浏览器信息、设置整体运行参数等。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()  # 创建浏览器对象
browser.set.retry_times(10)  # 设置整体运行参数
tab = browser.latest_tab  # 获取Tab对象
browser.quit()  # 关闭浏览器

✅️️ 标签页对象

Tab 对象从浏览器对象获取,每个 Tab 对象对应浏览器上一个实际的标签页。

大部分操作都使用 Tab 对象进行,如访问网站、调整窗口大小、监听网络等。

默认情况下每个标签页只有一个 Tab 对象,关闭单例模式后可用多个 Tab 对象同时控制一个标签页。

python 复制代码
from DrissionPage import Chromium

browser = Chromium()
tab1 = browser.latest_tab  # 获取最后激活的标签页对象
tab1.get('http://DrissionPage.cn')  # 标签页访问一个网址
tab2 = browser.new_tab('https://www.baidu.com')  # 新建一个标签页并访问网址
tab3 = browser.get_tab(title='DrissionPage')  # 按条件获取标签页对象

自动化中的xpath

python 复制代码
ele = tab.ele('xpath://input[@id="kw"]')

文本定位

文本值需要是唯一的,否则会发生错乱,不能精准定位。

python 复制代码
ele = tab.ele('text:登录')

获取文本和属性值

python 复制代码
ele_a = tab.ele('xpath://*[@id="s-top-left"]/a')

for i in ele_a:
    text = i.text   # 获取文本内容
    attr_value = i.attrs['href']  # 获取属性值
相关推荐
树獭非懒17 小时前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm
唐叔在学习20 小时前
就算没有服务器,我照样能够同步数据
后端·python·程序员
曲幽1 天前
FastAPI流式输出实战与避坑指南:让AI像人一样“边想边说”
python·ai·fastapi·web·stream·chat·async·generator·ollama
Flittly1 天前
【从零手写 AI Agent:learn-claude-code 项目实战笔记】(1)The Agent Loop (智能体循环)
python·agent
vivo互联网技术1 天前
ICLR2026 | 视频虚化新突破!Any-to-Bokeh 一键生成电影感连贯效果
人工智能·python·深度学习
敏编程1 天前
一天一个Python库:virtualenv - 隔离你的Python环境,保持项目整洁
python
喝茶与编码1 天前
Python异步并发控制:asyncio.gather 与 Semaphore 协同设计解析
后端·python
zone77391 天前
003:RAG 入门-LangChain 读取图片数据
后端·python·面试
用户8356290780511 天前
在 PowerPoint 中用 Python 添加和定制形状的完整教程
后端·python