[自动化]获取每次翻页后的页面 URL

from DrissionPage import ChromiumPage page = ChromiumPage() page.get('热门项目 - Gitee.com') page.listen.start('gitee.com/explore') for i in range(5): page("@rel=next").click() res= page.listen.wait() print(res.url)

这段代码使用了DrissionPage库中的ChromiumPage类来实现对网页的自动化操作。以下是对代码的解释:

  1. from DrissionPage import ChromiumPage:从DrissionPage库中导入ChromiumPage类,用于创建一个基于 Chromium 浏览器的页面操作对象。
  2. page = ChromiumPage():创建一个ChromiumPage对象,用于后续的页面操作。
  3. page.get('https://gitee.com/explore/all'):使用get方法打开指定的网页。
  4. page.listen.start('gitee.com/explore'):启动页面监听,监听与gitee.com/explore相关的事件。
  5. for i in range(5)::循环 5 次。
    • page("@rel=next").click():找到页面中rel属性为next的元素并点击,通常用于翻页操作。
    • res = page.listen.wait():等待监听事件触发,并获取相关的响应结果。
    • print(res.url):打印响应结果中的 URL。

这段代码的目的是模拟用户在网页上进行翻页操作,并获取每次翻页后的页面 URL。通过监听事件,可以获取页面加载完成后的相关信息。

请注意,在实际运行代码之前,需要确保已经安装了DrissionPage库及其相关依赖。此外,网页的结构和元素可能会发生变化,代码中的选择器@rel=next可能需要根据实际情况进行调整。

相关推荐
sakoba12 分钟前
Docker学习其二(容器卷,Docker网络,Compose)
运维·网络·学习·docker·容器·基础
PcVue China28 分钟前
法国彩虹重磅发布EmVue:解锁能源监控新方式
安全·自动化·软件工程·能源·数字化
来自于狂人39 分钟前
CentOS 镜像源配置与 EOL 后的应对策略
linux·运维·centos
柏木乃一3 小时前
Linux初步认识与指令与权限
linux·运维·服务器·shell·权限
Joemt3 小时前
ubuntu源码编译安装cmake高版本、pybind11安装、crow使用
linux·运维·ubuntu
真智AI4 小时前
打破数据质量瓶颈:用n8n实现30秒专业数据质量报告自动化
大数据·运维·人工智能·python·自动化
nightunderblackcat4 小时前
进阶向:自动化天气查询工具(API调用)
运维·自动化
企鹅侠客4 小时前
3 使用 Jenkins 构建镜像:将你的应用打包成镜像
运维·jenkins·jenkins构建镜像
阿萨德528号4 小时前
6、Redis高并发缓存方案和性能优化
运维·redis·缓存·性能优化
bigcarp5 小时前
linux + 宝塔面板 部署 django网站 启动方式:uwsgi 和gunicorn如何选择 ?
linux·运维·django