爬虫--翻页tips

免责声明:本文仅做分享!

伪线程

python 复制代码
from DrissionPage import ChromiumPage
import time

page = ChromiumPage()
page.get("https://you.ctrip.com/sight/taian746.html")
# 初始化 第0页
index_page = 0


# 翻页点击函数 + sleep
def page_turn():
    page.eles(".:ant-pagination-item-link")[3].click()
    time.sleep(2)


# 循环翻页
while True:
    # 非第一次翻页,获取数据. index_page>0
    if index_page > 0:
        try:
            # 获取数据
            for i in page.eles(".:sightItemCard_box__2FUEj "):
                print(i.text)
                print("=" * 30)
        except:
            # 没有数据,退出循环。
            print("no more sight")
            break
    # 第一次翻页,获取第一页数据。 index_page=0
    else:
        for i in page.eles(".:sightItemCard_box__2FUEj "):
            print(i.text)
            print("=" * 30)

            index_page += 1  #  ---> index_page=1
    # 翻页点击函数,sleep 2秒:
    page_turn()

··· 这个翻页有点好用ε=(´ο`*)))唉


相关推荐
闻道且行之几秒前
Pytorch之torch.nn.Conv2d详解
人工智能·pytorch·python·深度学习·conv2d
m0_7381207210 分钟前
应急响应——知攻善防挖矿事件应急溯源详细过程
网络·数据库·安全·web安全
文叔叔10 分钟前
大家都在装 OpenClaw,我选择自己实现一个
前端
西装没钱买16 分钟前
QT组播的建立和使用(绑定特定的网卡,绑定特定IP)
网络·c++·qt·udp·udp组播
蜡台23 分钟前
vue文件template ,script, style 多文件写法小记
前端·javascript·vue.js
qq_4042658327 分钟前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
qq_4523962334 分钟前
【Python × AI】Prompt Engineering 深度工程化:打造大模型的“确定性”控制链路
人工智能·python·ai·prompt
Bright Data36 分钟前
Pinterest 数据集示例
后端·python·flask
小江的记录本40 分钟前
【HTTP】HTTP请求方法与状态码(全体系知识总结+附表格)
前端·网络·后端·网络协议·http·状态模式·web