爬虫playwright中的等待机制

with本质上是管理了文件资源,这样创建对象

但是报错,类型错误,把.start删掉就能正常打开,

接下来在学习一下等待时机

等待机制

指定时间等待:(鼠标操作过快不正常,操作不宜过快,注意单位)

page.wait_for_timeout(毫秒)

等待加载完成:(按ctrl+鼠标左键可以跳转)

page.wait_for_load_state('load') (三种状态)

  • `'load'` - 等待 `load` 事件被触发。

  • `'domcontent loaded'` - 等待 `DOMContentLoaded` 事件触发。

  • `'networkidle'` - **不推荐** 等待至少 `500` 毫秒内无网络连接。请勿使用,这种方法依赖于网页断言来评估就绪状态。(如果有些网站加载过慢可以用)

html 文档

network kill:没有网络

等待元素状态:(先点击登录再输入内容,不点登录容易被判定为爬虫)

page.wait_for_selector(元素, state=状态)

  • visible:等待某个元素可见

  • hidden:等待某个元素隐藏 (两个状态)

判断一个元素是否存在用count

输完后还不出来,选中这一部分,复制为xpath,粘贴过来,用click

但是这样做有一个问题,就是输入太快了,不像人做的

用page.wait_for_timeout()来进行等待

相关推荐
OzupeSir17 小时前
三门两羊问题 - 蒙提霍尔问题
python·概率论
晚霞的不甘17 小时前
CANN asnumpy 深度解析:NPU 原生 NumPy 的使用指南
人工智能·python·numpy
lichenyang45317 小时前
鸿蒙聊天 Demo 练习 03:接入 Next.js 后端接口,实现真机前后端联调
前端
qingfeng1541517 小时前
企业微信 API 自动化开发指南:从消息回调到智能运营实战
java·开发语言·python·自动化·企业微信
小三金17 小时前
EXPO+RN echarts图表库,以及如何使用
前端·javascript·react.js
Just Jump17 小时前
tornado高性能高并发API服务网关
python·tornado·高并发api服务
晚霞的不甘17 小时前
CANN-MoE模型推理加速实战
人工智能·分布式·python
小新同学^O^17 小时前
简单学习 --> LangChain
python·学习·langchain
麻雀飞吧17 小时前
期货历史行情与实时数据一体化:主流平台维护负担对照
python
ZFSS18 小时前
Midjourney Shorten API 的集成与使用
java·前端·数据库·人工智能·ai·midjourney·ai编程