风火编程--playwright爬虫

playwright爬虫基本用法

等待加载

page.wait_for_load_state('networkidle')

text = page.content()

点击

demo

python 复制代码
 with sync_playwright() as pw:
        browser = pw.chromium.launch(headless=True)
        context = browser.new_context()
        page = context.new_page()
        page.goto(url)
        page.wait_for_load_state('networkidle')
        text = page.content()
        page.close()
        context.close()
        browser.close()
    info = parse_info(text)
    title = re.findall('''"Buy now:(.+?)",''', text)[0]

禁止加载图片

复制代码
    page.route("**/*", lambda route: route.abort()
    if route.request.resource_type == "image"
    else route.continue_())

登录状态

保存

python 复制代码
context.storage_state(path='login_data.json')

使用

python 复制代码
context = browser.new_context(storage_state='login_data.json')
相关推荐
上海云盾-小余8 小时前
业务接口防爬虫窃取:全链路鉴权与访问管控落地方案
爬虫
如烟花的信页15 小时前
易盾滑块逆向分析
javascript·爬虫·python·js逆向
zkkkkkkkkkkkkk16 小时前
python爬虫模拟拖动滑块缺口验证码
爬虫·python·ddddocr
AI分享猿16 小时前
用MonkeyCode做数据爬虫,效率提升10倍
爬虫
深蓝电商API18 小时前
深度解析Akamai Bot Manager:它是如何识别爬虫的
爬虫
深蓝电商API2 天前
AI驱动的自适应爬虫框架设计思路全解析
人工智能·爬虫
小白学大数据2 天前
AI 智能爬虫实战:Selenium+Python 自动绕反爬、一键提取数据
爬虫·python·selenium·数据分析
深蓝电商API2 天前
用LangChain + Playwright打造智能网页数据助手
爬虫·langchain
belong_my_offer2 天前
爬虫指南top one
爬虫
夏末蝉未鸣012 天前
跨境IT应用(4):用爬虫把产品关键词排名存进数据库,让运营随时回溯
爬虫