[自动化]获取每次翻页后的页面 URL

青龙摄影2024-11-26 13:04

from DrissionPage import ChromiumPage page = ChromiumPage() page.get('热门项目 - Gitee.com') page.listen.start('gitee.com/explore') for i in range(5): page("@rel=next").click() res= page.listen.wait() print(res.url)

这段代码使用了DrissionPage库中的ChromiumPage类来实现对网页的自动化操作。以下是对代码的解释：

from DrissionPage import ChromiumPage：从DrissionPage库中导入ChromiumPage类，用于创建一个基于 Chromium 浏览器的页面操作对象。
page = ChromiumPage()：创建一个ChromiumPage对象，用于后续的页面操作。
page.get('https://gitee.com/explore/all')：使用get方法打开指定的网页。
page.listen.start('gitee.com/explore')：启动页面监听，监听与gitee.com/explore相关的事件。
for i in range(5):：循环 5 次。
- page("@rel=next").click()：找到页面中rel属性为next的元素并点击，通常用于翻页操作。
- res = page.listen.wait()：等待监听事件触发，并获取相关的响应结果。
- print(res.url)：打印响应结果中的 URL。

这段代码的目的是模拟用户在网页上进行翻页操作，并获取每次翻页后的页面 URL。通过监听事件，可以获取页面加载完成后的相关信息。

请注意，在实际运行代码之前，需要确保已经安装了DrissionPage库及其相关依赖。此外，网页的结构和元素可能会发生变化，代码中的选择器@rel=next可能需要根据实际情况进行调整。