前言
本文主要介绍了DrissionPage的基本用法,需要详细了解的可以查看DP官网。
DrissionPage官方文档:https://www.drissionpage.cn/browser_control/intro
基本逻辑如下:
- 创建浏览器对象,用于启动或接管浏览器(打开浏览器)
- 获取一个 Tab 对象
- 使用 Tab 对象访问网址
- 使用 Tab 对象获取标签页内需要的元素对象
- 使用元素对象进行交互
除此以外,还能执行更为复杂的操作,如执行 js 代码、监听网络数据、下载文件等。
使用DrissionPage之前需要安装这个第三方库:
            
            
              cmd
              
              
            
          
          pip install DrissionPage
            
            
              python
              
              
            
          
          from Drission import Chromium
# 1. 创建浏览器对象
browser = Chromium()
# 2. 获取一个最新 Tab(标签页)对象
tab = browser.latest_tab
# 3. 使用tab对象访问网址
tab.get("https://www.baidu.com")
# 4. 使用tab对象获取标签页内需要的元素对象
# 根据CSS选择器获取元素
ele = tab.ele("#kw")
# 5. 使用元素对象进行交互
# 向文本框元素输入对象输入文本
ele.input("python")
# 6. 获取点击按钮元素
btn_ele = tab.ele('#su')
# 7. 元素点击(通过js点击)
btn_ele.click(by_js=True)
# ----------------------------------------
# 也可以使用tab对象直接添加选择器的方式调用元素对象方法,因为会自动调用获取元素ele方法
tab("#kw").input('python')  # 内部自动调用了ele方法✅️️ 浏览器对象
即Chromium对象,用于管理浏览器整体相关的操作。
如标签页管理、获取浏览器信息、设置整体运行参数等。
            
            
              python
              
              
            
          
          from DrissionPage import Chromium
browser = Chromium()  # 创建浏览器对象
browser.set.retry_times(10)  # 设置整体运行参数
tab = browser.latest_tab  # 获取Tab对象
browser.quit()  # 关闭浏览器✅️️ 标签页对象
Tab 对象从浏览器对象获取,每个 Tab 对象对应浏览器上一个实际的标签页。
大部分操作都使用 Tab 对象进行,如访问网站、调整窗口大小、监听网络等。
默认情况下每个标签页只有一个 Tab 对象,关闭单例模式后可用多个 Tab 对象同时控制一个标签页。
            
            
              python
              
              
            
          
          from DrissionPage import Chromium
browser = Chromium()
tab1 = browser.latest_tab  # 获取最后激活的标签页对象
tab1.get('http://DrissionPage.cn')  # 标签页访问一个网址
tab2 = browser.new_tab('https://www.baidu.com')  # 新建一个标签页并访问网址
tab3 = browser.get_tab(title='DrissionPage')  # 按条件获取标签页对象自动化中的xpath
            
            
              python
              
              
            
          
          ele = tab.ele('xpath://input[@id="kw"]')文本定位
文本值需要是唯一的,否则会发生错乱,不能精准定位。
            
            
              python
              
              
            
          
          ele = tab.ele('text:登录')获取文本和属性值
            
            
              python
              
              
            
          
          ele_a = tab.ele('xpath://*[@id="s-top-left"]/a')
for i in ele_a:
    text = i.text   # 获取文本内容
    attr_value = i.attrs['href']  # 获取属性值