爬虫--翻页tips

免责声明:本文仅做分享!

伪线程

python 复制代码
from DrissionPage import ChromiumPage
import time

page = ChromiumPage()
page.get("https://you.ctrip.com/sight/taian746.html")
# 初始化 第0页
index_page = 0


# 翻页点击函数 + sleep
def page_turn():
    page.eles(".:ant-pagination-item-link")[3].click()
    time.sleep(2)


# 循环翻页
while True:
    # 非第一次翻页,获取数据. index_page>0
    if index_page > 0:
        try:
            # 获取数据
            for i in page.eles(".:sightItemCard_box__2FUEj "):
                print(i.text)
                print("=" * 30)
        except:
            # 没有数据,退出循环。
            print("no more sight")
            break
    # 第一次翻页,获取第一页数据。 index_page=0
    else:
        for i in page.eles(".:sightItemCard_box__2FUEj "):
            print(i.text)
            print("=" * 30)

            index_page += 1  #  ---> index_page=1
    # 翻页点击函数,sleep 2秒:
    page_turn()

··· 这个翻页有点好用ε=(´ο`*)))唉


相关推荐
清水白石0081 分钟前
Python 柯里化完全指南:从函数式思想到工程实践
linux·服务器·python
脱离语言16 分钟前
Jeecg3.8.2 前端经验汇总
开发语言·前端·javascript
NEXT0633 分钟前
useMemo 与 useCallback 的原理与最佳实践
前端·javascript·react.js
小爱丨同学34 分钟前
React-Context用法汇总 +注意点
前端·javascript·react.js
myzzb1 小时前
纯python 最快png转换RGB截图方案 ——deepseek
开发语言·python·学习·开源·开发
宸迪1 小时前
【python】使用uv管理项目包依赖
linux·python·uv
qq_448011161 小时前
python中的内置globals()详解
开发语言·python
weixin_440401691 小时前
Coze-智能体Agent(工作流:自定义插件+选择器+知识库检索+大模型润色)
python·ai·coze
Ulyanov2 小时前
基于Python的单脉冲雷达导引头回波生成技术
python·算法·仿真·单脉冲雷达、
deepxuan2 小时前
Day2--python三大库-numpy
开发语言·python·numpy