爬虫playwright中的等待机制

with本质上是管理了文件资源,这样创建对象

但是报错,类型错误,把.start删掉就能正常打开,

接下来在学习一下等待时机

等待机制

指定时间等待:(鼠标操作过快不正常,操作不宜过快,注意单位)

page.wait_for_timeout(毫秒)

等待加载完成:(按ctrl+鼠标左键可以跳转)

page.wait_for_load_state('load') (三种状态)

  • `'load'` - 等待 `load` 事件被触发。

  • `'domcontent loaded'` - 等待 `DOMContentLoaded` 事件触发。

  • `'networkidle'` - **不推荐** 等待至少 `500` 毫秒内无网络连接。请勿使用,这种方法依赖于网页断言来评估就绪状态。(如果有些网站加载过慢可以用)

html 文档

network kill:没有网络

等待元素状态:(先点击登录再输入内容,不点登录容易被判定为爬虫)

page.wait_for_selector(元素, state=状态)

  • visible:等待某个元素可见

  • hidden:等待某个元素隐藏 (两个状态)

判断一个元素是否存在用count

输完后还不出来,选中这一部分,复制为xpath,粘贴过来,用click

但是这样做有一个问题,就是输入太快了,不像人做的

用page.wait_for_timeout()来进行等待

相关推荐
海棠AI实验室2 分钟前
第四章 项目目录结构:src/、configs/、data/、tests/ 的黄金布局
python·项目目录结构
风度前端34 分钟前
用了都说好的 uniapp 路由框架
前端
冴羽35 分钟前
2026 年 Web 前端开发的 8 个趋势!
前端·javascript·vue.js
码银44 分钟前
ruoyi的前端(vue)新增的时候给字典设置默认值 但不能正常
前端
爱笑的眼睛111 小时前
超越可视化:降维算法组件的深度解析与工程实践
java·人工智能·python·ai
凌览1 小时前
别再死磕 Nginx!http-proxy-middleware 低配置起飞
前端·后端
清铎1 小时前
leetcode_day12_滑动窗口_《绝境求生》
python·算法·leetcode·动态规划
ai_top_trends2 小时前
2026 年工作计划 PPT 横评:AI 自动生成的优劣分析
人工智能·python·powerpoint
TDengine (老段)2 小时前
TDengine Python 连接器进阶指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
EndingCoder2 小时前
类的继承和多态
linux·运维·前端·javascript·ubuntu·typescript