爬虫--翻页tips

免责声明:本文仅做分享!

伪线程

python 复制代码
from DrissionPage import ChromiumPage
import time

page = ChromiumPage()
page.get("https://you.ctrip.com/sight/taian746.html")
# 初始化 第0页
index_page = 0


# 翻页点击函数 + sleep
def page_turn():
    page.eles(".:ant-pagination-item-link")[3].click()
    time.sleep(2)


# 循环翻页
while True:
    # 非第一次翻页,获取数据. index_page>0
    if index_page > 0:
        try:
            # 获取数据
            for i in page.eles(".:sightItemCard_box__2FUEj "):
                print(i.text)
                print("=" * 30)
        except:
            # 没有数据,退出循环。
            print("no more sight")
            break
    # 第一次翻页,获取第一页数据。 index_page=0
    else:
        for i in page.eles(".:sightItemCard_box__2FUEj "):
            print(i.text)
            print("=" * 30)

            index_page += 1  #  ---> index_page=1
    # 翻页点击函数,sleep 2秒:
    page_turn()

··· 这个翻页有点好用ε=(´ο`*)))唉


相关推荐
wm10431 分钟前
代码随想录第十天 栈和队列
开发语言·python
双层吉士憨包3 分钟前
如何注册Talkatone免费美国号码?实测有效方案
大数据·运维·网络
BHXDML8 分钟前
TCP/IP 协议栈深度解析:互联网的神经系统
网络·网络协议·tcp/ip
CS创新实验室15 分钟前
《计算机网络》深入学:点对点协议 (PPP)
网络·计算机网络·php·ppp协议·点对点协议
一人の梅雨16 分钟前
义乌购商品详情接口进阶实战:批发场景下的精准解析与高可用架构
java·服务器·前端
飞Link18 分钟前
PyTorch 核心 API 完全手册:从基础张量到模型部署
人工智能·pytorch·python·深度学习·机器学习
bin915321 分钟前
(文后附完整代码)html+css+javascript 弓箭射击游戏项目分析
前端·javascript·css·游戏·html·前端开发
Dxy123931021625 分钟前
Python使用Playwright入门教程:从环境搭建到实战应用
开发语言·python·playwright
翱翔的苍鹰29 分钟前
完整的“RNN + jieba 中文情感分析”项目的Gradio Web 演示的简单项目
前端·人工智能·rnn
墨抒颖 msy.plus33 分钟前
如何构建现代Agent以OpenManus为例
python·ai编程