[自动化]获取每次翻页后的页面 URL

from DrissionPage import ChromiumPage page = ChromiumPage() page.get('热门项目 - Gitee.com') page.listen.start('gitee.com/explore') for i in range(5): page("@rel=next").click() res= page.listen.wait() print(res.url)

这段代码使用了DrissionPage库中的ChromiumPage类来实现对网页的自动化操作。以下是对代码的解释:

  1. from DrissionPage import ChromiumPage:从DrissionPage库中导入ChromiumPage类,用于创建一个基于 Chromium 浏览器的页面操作对象。
  2. page = ChromiumPage():创建一个ChromiumPage对象,用于后续的页面操作。
  3. page.get('https://gitee.com/explore/all'):使用get方法打开指定的网页。
  4. page.listen.start('gitee.com/explore'):启动页面监听,监听与gitee.com/explore相关的事件。
  5. for i in range(5)::循环 5 次。
    • page("@rel=next").click():找到页面中rel属性为next的元素并点击,通常用于翻页操作。
    • res = page.listen.wait():等待监听事件触发,并获取相关的响应结果。
    • print(res.url):打印响应结果中的 URL。

这段代码的目的是模拟用户在网页上进行翻页操作,并获取每次翻页后的页面 URL。通过监听事件,可以获取页面加载完成后的相关信息。

请注意,在实际运行代码之前,需要确保已经安装了DrissionPage库及其相关依赖。此外,网页的结构和元素可能会发生变化,代码中的选择器@rel=next可能需要根据实际情况进行调整。

相关推荐
wei_work@2 分钟前
【linux】简单的shell脚本练习
linux·运维·服务器
我才是鳴海步19 分钟前
基于docker技术的单主机环境模拟测试批量客户端
运维·docker·容器
conkl2 小时前
Apache网页优化实战指南 - 让网站加载速度提升
linux·运维·服务器·开发语言·阿里云·apache
thinkMoreAndDoMore2 小时前
linux驱动开发(9)- 信号量
linux·运维·驱动开发
海天胜景2 小时前
nginx 配置返回 文件大小
运维·nginx
五阿哥爱跳舞3 小时前
【环境配置】解决linux每次打开终端都需要source .bashrc文件的问题
linux·运维·服务器
时央1234563 小时前
C#使用Tuple方法实现OpreateResultModel功能
运维·开发语言·c#
爱学习的白杨树3 小时前
Spring Cloud Gateway 介绍
java·运维·开发语言
网易独家音乐人Mike Zhou3 小时前
【Linux应用】Linux系统日志上报服务,以及thttpd的配置、发送函数
linux·运维·服务器·mcu·物联网·嵌入式·iot
bingbingyihao4 小时前
服务自动添加实例工具
linux·运维·bash