puppeteer常规操作代码段

目录

一、获取界面二维码并打印处理

[二、等待某个元素消失后 再进行操作](#二、等待某个元素消失后 再进行操作)

三、使用puppteer点击搜索框,并输入内容后点击搜索


一、获取界面二维码并打印处理

javascript 复制代码
const puppeteer = require('puppeteer');

async function findQRCodeByXPath() {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();

  await page.goto('https://example.com');

  const xPath = '//img[contains(@class, "qrcode")]'; // 替换为实际的 XPath 表达式

  const qrcodeElements = await page.$x(xPath);

  if (qrcodeElements.length > 0) {
    const qrcodeHandle = await page.evaluateHandle((el) => el.getAttribute('src'), qrcodeElements[0]);
    const qrcodeData = await qrcodeHandle.jsonValue();

    console.log('二维码:', qrcodeData);
    // 在这里可以进行二维码的处理
  } else {
    console.log('没有找到二维码');
  }

  await browser.close();
}

findQRCodeByXPath();

二、等待某个元素消失后 再进行操作

javascript 复制代码
const puppeteer = require('puppeteer');

async function waitForPopupToDisappearAndScroll() {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();

  await page.goto('https://example.com');

  const popupSelector = '.popup'; // 替换为实际弹框元素的 CSS 选择器

  try {
    await page.waitForSelector(popupSelector, { timeout: 5000 });

    // 弹框出现,等待其消失
    await page.waitForSelector(popupSelector, { hidden: true, timeout: 5000 });

    console.log('弹框已消失');

    // 执行其他滑动界面操作
    await page.evaluate(() => {
      // 执行滑动操作的代码
    });
  } catch (error) {
    console.log('没有弹框');
  }

  await browser.close();
}

waitForPopupToDisappearAndScroll();

三、使用puppteer点击搜索框,并输入内容后点击搜索

javascript 复制代码
//1. 使用 Puppeteer 打开页面:

const puppeteer = require('puppeteer');

const main = async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com'); // 替换为目标网页 URL
  // 执行后续操作
};

main();


// 2. 点击搜索框并输入关键字:

// 在相应的选择器上执行点击操作
await page.click('input[name="search"]');
// 等待一定时间,确保搜索框被激活
await page.waitForTimeout(1000); // 1秒
// 在相应的选择器上执行输入操作
await page.type('input[name="search"]', '关键字');


// 3. 等待结果出现并滑动界面到底:

// 等待搜索结果出现,这里使用简单的等待时间,也可以根据实际情况使用更复杂的等待条件
await page.waitForTimeout(3000); // 3秒

while (true) {
  // 滑动到底部
  await page.evaluate(() => {
    window.scrollTo(0, document.body.scrollHeight);
  });

  // 等待一小段时间,让页面加载内容
  await page.waitForTimeout(1000); // 1秒

  // 检查是否已经滑动到底部(可以根据页面元素,如底部加载提示等判断)
  const isEndReached = await page.evaluate(() => {
    // 检查页面是否已经滑动到底部的逻辑,例如:
    // return document.querySelector('#load-more-button') === null;
    // 如果你有特定的元素表示已经到达底部,请适配对应的逻辑
  });

  if (isEndReached) {
    break;
  }
}
相关推荐
亿牛云爬虫专家7 天前
Puppeteer的高级用法:如何在Node.js中实现复杂的Web Scraping
前端·javascript·爬虫·node.js·爬虫代理·puppeteer·代理ip
omage9 天前
如何解决npm下载Puppeteer卡死的问题
前端·npm·node.js·puppeteer
亿牛云爬虫专家9 天前
利用Puppeteer-Har记录与分析网页抓取中的性能数据
chrome·node.js·浏览器·爬虫代理·puppeteer·chromium·代理ip
倪风610 天前
关于puppeteer项目部署到ubuntu报错记录
linux·运维·chrome·ubuntu·puppeteer·nest
Smartdaili China13 天前
使用 Puppeteer-Cluster 和代理进行高效网络抓取: 完全指南
大数据·开发语言·网络·爬虫·php·puppeteer·代理服务器
AskHarries1 个月前
利用puppeteer将html网页生成图片
java·spring boot·后端·puppeteer
小鑫同学3 个月前
Puppeteer:从零出发,全面掌握浏览器自动化神器
前端·puppeteer
TangAcrab3 个月前
puppeteer 爬虫初探
puppeteer·puppeteer 爬虫
Dsw_FE4 个月前
应用node Puppeteer爬取数据
爬虫·puppeteer
struggle_coder4 个月前
【Could not find Chrome This can occur if either】
前端·chrome·node·puppeteer