puppeteer安装使用以及"Failed to set up Chrome v122.0.6261.94!"下载失败问题解决

概述

Puppeteer 是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome。

Puppeteer 是 Google Chrome 团队官方的无界面(Headless)Chrome 工具 。所以这个库一般默认打开Chrome或者是Chromium 。如果要使用这个库去操作edge 的话,会出现一定的限制,那此时,朋友你就更应该去了解一下playwright这个库。

回到原来的话题,puppetter的功能十分强大 ,可以做到很多好玩的事情。例如:生成页面的截图和PDF,抓取SSR,抓取网站内容,模拟登陆等。一般来说,写爬虫都会用到这个。

实现步骤

1.新建文件夹,在VScode集成终端打开

2.初始化项目

csharp 复制代码
npm init

3.安装puppeteer

css 复制代码
npm i puppeteer --save

安装时可能出现的报错

出于安全考虑,npm不支持以 root 用户运行,用 root 用户身份运行,npm 会自动转成一个叫 nobody 的用户来运行,而这个用户几乎没有任何权限。这样脚本里有一些需要权限的操作,比如写文件(尤其是写 /root/.node-gyp),就会报错了。简单来说就是在puppeteer下载的时候,需要下载相关的Chrome,但此时的权限不够,就造成了puppeteer下载失败

解决方法一:

设置跳过Chrome的下载

命令行输入

ini 复制代码
set PUPPETEER_SKIP_DOWNLOAD="true"

然后再次运行

css 复制代码
npm i puppeteer

但是这种方法之后,需要去自己下载相关的Chrome。并在使用的时候进行一个路径的引入。

(我一开始也是用的这个方法,但是会接着跳出下一个无法安装,所以就尝试了方法二)

解决方法二(亲测好用):

跳过所有相关脚本的下载

命令行输入

css 复制代码
npm install puppeteer --ignore-scripts

此时就跳过了所有相关脚本的下载,用这种方法下载的puppeteer和puppeteer-core类似

该方法和方法一一样需要在使用的时候进行相关的路径引入

解决方法三:

命令行输入

ini 复制代码
npm install puppeteer --unsafe-perm=true --allow-root

--unsafe-perm=true:这个选项的意思就是告知npm在暗转的过程中忽略权限检查。

--allow-root:这个选线允许用root用户身份安装包

ps: 这样子安装的话,可能会存在一定的风险。

4.运行puppeteer

新建一个demo.js,引入puppeteer包,然后配置Chrome的启动路径。调用puppeteer.launch()方法启动Chrome。以下是一个简单的示例。

js 复制代码
const puppeteer = require('puppeteer');
​
async function openWebsite() {
  const browser = await puppeteer.launch({
    //注意:这里配置的就是自己下载的本地Chrome可执行文件的路径
    executablePath: "C:\AppData\Local\Google\Chrome\Application\chrome.exe", 
    //这个配置项的意思是:是否无界面,这里选择有界面,方便调试
    headless: false
  });
​
  const page = await browser.newPage();
  //goto中的参数,选择打算访问的网页,这里选择的是百度
  await page.goto('https://www.iqiyi.com/?vfm=f_588_wrb&fv=ac30238882b84c8c');
​
  await browser.close();
}
​
openWebsite();
相关推荐
摇滚侠2 小时前
搭建前端开发环境 安装 nodejs 设置淘宝镜像 最简化最标准版本 不使用 NVM NVM 高版本无法安装低版本 nodejs
java·开发语言·node.js
tumeng071110 小时前
Node.JS 版本管理工具 Fnm 安装及配置(Windows)
windows·node.js
xrkhy11 小时前
MacOS M3 安装nvm以及node.js
macos·node.js
xiaohe0712 小时前
Node.js NativeAddon 构建工具:node-gyp 安装与配置完全指南
node.js
不愿透露姓名的大鹏12 小时前
Linux环境下Node.js后台运行方式(实用版)
linux·运维·node.js
学习3人组13 小时前
windows系统下nvm的安装
node.js·nvm
sunwenjian88613 小时前
node.js下载、安装、设置国内镜像源(永久)(Windows11)
node.js
#做一个清醒的人13 小时前
Electron 保活方案:用子进程彻底解决原生插件崩溃问题
前端·electron·node.js
云天00114 小时前
前端私活神器,nodejs+vue3+typescript全栈框架,
前端·后端·node.js
吴声子夜歌14 小时前
Node.js——WebSocket
websocket·网络协议·node.js