[自动化]获取每次翻页后的页面 URL

from DrissionPage import ChromiumPage page = ChromiumPage() page.get('热门项目 - Gitee.com') page.listen.start('gitee.com/explore') for i in range(5): page("@rel=next").click() res= page.listen.wait() print(res.url)

这段代码使用了DrissionPage库中的ChromiumPage类来实现对网页的自动化操作。以下是对代码的解释:

  1. from DrissionPage import ChromiumPage:从DrissionPage库中导入ChromiumPage类,用于创建一个基于 Chromium 浏览器的页面操作对象。
  2. page = ChromiumPage():创建一个ChromiumPage对象,用于后续的页面操作。
  3. page.get('https://gitee.com/explore/all'):使用get方法打开指定的网页。
  4. page.listen.start('gitee.com/explore'):启动页面监听,监听与gitee.com/explore相关的事件。
  5. for i in range(5)::循环 5 次。
    • page("@rel=next").click():找到页面中rel属性为next的元素并点击,通常用于翻页操作。
    • res = page.listen.wait():等待监听事件触发,并获取相关的响应结果。
    • print(res.url):打印响应结果中的 URL。

这段代码的目的是模拟用户在网页上进行翻页操作,并获取每次翻页后的页面 URL。通过监听事件,可以获取页面加载完成后的相关信息。

请注意,在实际运行代码之前,需要确保已经安装了DrissionPage库及其相关依赖。此外,网页的结构和元素可能会发生变化,代码中的选择器@rel=next可能需要根据实际情况进行调整。

相关推荐
乘云数字DATABUFF7 小时前
5分钟部署开源APM Databuff:OpenTelemetry全链路追踪入门实战
运维·后端
荣--2 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森2 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜3 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
SelectDB4 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维
XIAOHEZIcode5 天前
Linux系统鼠标偏移常见原因以及修复方案
linux·运维·游戏
用户0328472220706 天前
如何搭建本地yum源(上)
运维
大树889 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠9 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质9 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务