wait_until=“domcontentloaded“ 解释

一、Playwright 支持四种等待模式:

  • commit: 服务器输出数据,建立连接后就返回(页面可能还没有东西)
  • domcontentloaded: HTML 骨架加载完成,此时可以进行 DOM 操作
  • load: 页面所有东西(包括大图片、外部资源)全部下完
  • networkidle: 彻底加载完,包括异步请求

二、为什么要用 domcontentloaded:

  • 抢时间: 等待很多不需要的图片,需要耗费很多时间,但想要的数据早在 HTML 骨架里,不需要等待图片。
  • 避开无效干扰: 很多反爬虫插件或广告是在页面 load 之后才执行的。提前介入(DOM 加载完就操作)有时能绕过一些动态干扰。

三、总结:

  • 如果网页数据在 HTML 源码里:用 domcontentloaded。

  • 如果网页数据是靠 JS 后来渲染生成的:建议用 networkidle。

相关推荐
Freak嵌入式14 小时前
MicroPython LVGL基础知识和概念:时序与动态效果
开发语言·python·github·php·gui·lvgl·micropython
_院长大人_15 小时前
Vue + ECharts 实现价格趋势分析图
前端·vue.js·echarts
疯笔码良15 小时前
【Vue】自适应布局
javascript·vue.js·css3
浩星15 小时前
electron系列2:搭建专业Electron开发环境
javascript·typescript·electron
2501_9333295515 小时前
企业媒体发布与舆情管理实战:Infoseek舆情系统技术架构与落地解析
大数据·开发语言·人工智能·数据库开发
"菠萝"15 小时前
C#知识学习-021(文字关键字)
开发语言·学习·c#
minji...15 小时前
Linux 线程同步与互斥(二) 线程同步,条件变量,pthread_cond_init/wait/signal/broadcast
linux·运维·开发语言·jvm·数据结构·c++
zhangzeyuaaa15 小时前
Python 中的 Map 和 Reduce 详解
开发语言·python
深蓝电商API15 小时前
分布式爬虫在海淘数据采集中的应用
爬虫·反向海淘