风火编程--playwright爬虫

playwright爬虫基本用法

等待加载

page.wait_for_load_state('networkidle')

text = page.content()

点击

demo

python 复制代码
 with sync_playwright() as pw:
        browser = pw.chromium.launch(headless=True)
        context = browser.new_context()
        page = context.new_page()
        page.goto(url)
        page.wait_for_load_state('networkidle')
        text = page.content()
        page.close()
        context.close()
        browser.close()
    info = parse_info(text)
    title = re.findall('''"Buy now:(.+?)",''', text)[0]

禁止加载图片

    page.route("**/*", lambda route: route.abort()
    if route.request.resource_type == "image"
    else route.continue_())

登录状态

保存

python 复制代码
context.storage_state(path='login_data.json')

使用

python 复制代码
context = browser.new_context(storage_state='login_data.json')
相关推荐
愚公搬代码4 小时前
【愚公系列】《Python网络爬虫从入门到精通》045-Charles的SSL证书的安装
网络·爬虫·python·网络协议·ssl
cliff,6 小时前
【python爬虫】酷狗音乐爬取
笔记·爬虫·python·学习
数据小小爬虫16 小时前
利用PHP爬虫获取17网(17zwd)商品详情:实战指南
开发语言·爬虫·php
猿小猴子17 小时前
Python3 爬虫 爬虫中间件
爬虫·中间件
q5673152317 小时前
使用Lua和lua-resty-http-simple库的爬虫程序爬取图片
爬虫·http·lua
SRC_BLUE_1720 小时前
[网络爬虫] 动态网页抓取 — Selenium 介绍 & 环境配置
网络·爬虫·selenium·测试工具
B站计算机毕业设计超人1 天前
计算机毕业设计Python+DeepSeek-R1大模型微博舆情分析系统 微博舆情预测 微博爬虫 微博大数 据(源码+LW文档+PPT+详细讲解)
爬虫·python·学习·算法·机器学习·毕业设计·数据可视化
朱剑君1 天前
番外篇 - Docker的使用
爬虫·docker·容器
九丶黎1 天前
爬虫案例七Python协程爬取视频
爬虫·python·音视频
HerrFu1 天前
可狱可囚的爬虫系列课程 19:静态页面和动态页面之分
爬虫·python