wait_until=“domcontentloaded“ 解释

一、Playwright 支持四种等待模式:

  • commit: 服务器输出数据,建立连接后就返回(页面可能还没有东西)
  • domcontentloaded: HTML 骨架加载完成,此时可以进行 DOM 操作
  • load: 页面所有东西(包括大图片、外部资源)全部下完
  • networkidle: 彻底加载完,包括异步请求

二、为什么要用 domcontentloaded:

  • 抢时间: 等待很多不需要的图片,需要耗费很多时间,但想要的数据早在 HTML 骨架里,不需要等待图片。
  • 避开无效干扰: 很多反爬虫插件或广告是在页面 load 之后才执行的。提前介入(DOM 加载完就操作)有时能绕过一些动态干扰。

三、总结:

  • 如果网页数据在 HTML 源码里:用 domcontentloaded。

  • 如果网页数据是靠 JS 后来渲染生成的:建议用 networkidle。

相关推荐
Data_Journal12 小时前
【无标题】
大数据·服务器·前端·数据库·人工智能
qq_1927798712 小时前
Python多线程与多进程:如何选择?(GIL全局解释器锁详解)
jvm·数据库·python
2301_7657031412 小时前
C++代码复杂度控制
开发语言·c++·算法
naruto_lnq12 小时前
NumPy入门:高性能科学计算的基础
jvm·数据库·python
m0_7088309612 小时前
C++中的享元模式实战
开发语言·c++·算法
我爱加班、、12 小时前
new Map()+Array.from()整理elementPlus的级联器数据
linux·前端·javascript
工程师老罗12 小时前
Pytorch中的优化器及其用法
人工智能·pytorch·python
naruto_lnq12 小时前
分布式计算C++库
开发语言·c++·算法
Hx_Ma1612 小时前
Map集合的5种遍历方式
java·前端·javascript
2501_9481201512 小时前
大语言模型与爬虫技术融合的智能数据采集系统
人工智能·爬虫·语言模型