爬虫--翻页tips

免责声明:本文仅做分享!

伪线程

python 复制代码
from DrissionPage import ChromiumPage
import time

page = ChromiumPage()
page.get("https://you.ctrip.com/sight/taian746.html")
# 初始化 第0页
index_page = 0


# 翻页点击函数 + sleep
def page_turn():
    page.eles(".:ant-pagination-item-link")[3].click()
    time.sleep(2)


# 循环翻页
while True:
    # 非第一次翻页,获取数据. index_page>0
    if index_page > 0:
        try:
            # 获取数据
            for i in page.eles(".:sightItemCard_box__2FUEj "):
                print(i.text)
                print("=" * 30)
        except:
            # 没有数据,退出循环。
            print("no more sight")
            break
    # 第一次翻页,获取第一页数据。 index_page=0
    else:
        for i in page.eles(".:sightItemCard_box__2FUEj "):
            print(i.text)
            print("=" * 30)

            index_page += 1  #  ---> index_page=1
    # 翻页点击函数,sleep 2秒:
    page_turn()

··· 这个翻页有点好用ε=(´ο`*)))唉


相关推荐
m0_736439308 小时前
如何防止SQL非法金额输入_利用触发器实现精确度校准
jvm·数据库·python
麻雀飞吧8 小时前
期货量化多周期策略实践:主趋势过滤与入场触发协同
python
小张同学8248 小时前
Python并发编程实战用多线程和协程加速智能体执行效率
开发语言·人工智能·python
2301_815901978 小时前
HTML函数在4K显示器上显示异常吗_高分辨率硬件适配问题【详解】
jvm·数据库·python
WL_Aurora8 小时前
【每日一题】前缀和
python·算法
可视化运维管理爱好者8 小时前
pi mono操作开发指南
运维·网络·ai
盼小辉丶8 小时前
PyTorch强化学习实战(4)——PyTorch基础
人工智能·pytorch·python·强化学习
可达鸭小栈8 小时前
易语言实现CSS像素文字生成器:无需字体文件渲染汉字
前端·css
fox_lht8 小时前
DBeaver的LightGrid 类所有函数详细分析
前端
YJlio8 小时前
10.2.8 以其他账户运行服务(Running services in alternate accounts):为什么“把服务切到某个用户账号下运行”,本质上是在改变服务的整个安全上下文?
python·安全·ios·机器人·django·iphone·7-zip