爬虫playwright中的等待机制

with本质上是管理了文件资源,这样创建对象

但是报错,类型错误,把.start删掉就能正常打开,

接下来在学习一下等待时机

等待机制

指定时间等待:(鼠标操作过快不正常,操作不宜过快,注意单位)

page.wait_for_timeout(毫秒)

等待加载完成:(按ctrl+鼠标左键可以跳转)

page.wait_for_load_state('load') (三种状态)

  • `'load'` - 等待 `load` 事件被触发。

  • `'domcontent loaded'` - 等待 `DOMContentLoaded` 事件触发。

  • `'networkidle'` - **不推荐** 等待至少 `500` 毫秒内无网络连接。请勿使用,这种方法依赖于网页断言来评估就绪状态。(如果有些网站加载过慢可以用)

html 文档

network kill:没有网络

等待元素状态:(先点击登录再输入内容,不点登录容易被判定为爬虫)

page.wait_for_selector(元素, state=状态)

  • visible:等待某个元素可见

  • hidden:等待某个元素隐藏 (两个状态)

判断一个元素是否存在用count

输完后还不出来,选中这一部分,复制为xpath,粘贴过来,用click

但是这样做有一个问题,就是输入太快了,不像人做的

用page.wait_for_timeout()来进行等待

相关推荐
曲幽13 分钟前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
兆子龙25 分钟前
用 Auto.js 实现挂机脚本:从找图点击到循环自动化
前端·架构
SuperEugene31 分钟前
表单最佳实践:从 v-model 到自定义表单组件(含校验)
前端·javascript·vue.js
昨晚我输给了一辆AE8631 分钟前
为什么现在不推荐使用 React.FC 了?
前端·react.js·typescript
不会敲代码132 分钟前
深入浅出 React 闭包陷阱:从现象到原理
前端·react.js
不会敲代码134 分钟前
React性能优化:深入理解useMemo和useCallback
前端·javascript·react.js
Dilettante25836 分钟前
我的 Monorepo 实践经验:从基础概念到最佳实践
前端·前端工程化
老赵全栈实战41 分钟前
Pydantic配置管理最佳实践(一)
python
只会cv的前端攻城狮1 小时前
Elpis-Core — 融合 Koa 洋葱圈模型实现服务端引擎
前端·后端
Java小卷2 小时前
流程设计器为啥选择diagram-js
前端·低代码·工作流引擎