puppeteer安装使用以及"Failed to set up Chrome v122.0.6261.94!"下载失败问题解决

概述

Puppeteer 是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome。

Puppeteer 是 Google Chrome 团队官方的无界面(Headless)Chrome 工具 。所以这个库一般默认打开Chrome或者是Chromium 。如果要使用这个库去操作edge 的话,会出现一定的限制,那此时,朋友你就更应该去了解一下playwright这个库。

回到原来的话题,puppetter的功能十分强大 ,可以做到很多好玩的事情。例如:生成页面的截图和PDF,抓取SSR,抓取网站内容,模拟登陆等。一般来说,写爬虫都会用到这个。

实现步骤

1.新建文件夹,在VScode集成终端打开

2.初始化项目

csharp 复制代码
npm init

3.安装puppeteer

css 复制代码
npm i puppeteer --save

安装时可能出现的报错

出于安全考虑,npm不支持以 root 用户运行,用 root 用户身份运行,npm 会自动转成一个叫 nobody 的用户来运行,而这个用户几乎没有任何权限。这样脚本里有一些需要权限的操作,比如写文件(尤其是写 /root/.node-gyp),就会报错了。简单来说就是在puppeteer下载的时候,需要下载相关的Chrome,但此时的权限不够,就造成了puppeteer下载失败

解决方法一:

设置跳过Chrome的下载

命令行输入

ini 复制代码
set PUPPETEER_SKIP_DOWNLOAD="true"

然后再次运行

css 复制代码
npm i puppeteer

但是这种方法之后,需要去自己下载相关的Chrome。并在使用的时候进行一个路径的引入。

(我一开始也是用的这个方法,但是会接着跳出下一个无法安装,所以就尝试了方法二)

解决方法二(亲测好用):

跳过所有相关脚本的下载

命令行输入

css 复制代码
npm install puppeteer --ignore-scripts

此时就跳过了所有相关脚本的下载,用这种方法下载的puppeteer和puppeteer-core类似

该方法和方法一一样需要在使用的时候进行相关的路径引入

解决方法三:

命令行输入

ini 复制代码
npm install puppeteer --unsafe-perm=true --allow-root

--unsafe-perm=true:这个选项的意思就是告知npm在暗转的过程中忽略权限检查。

--allow-root:这个选线允许用root用户身份安装包

ps: 这样子安装的话,可能会存在一定的风险。

4.运行puppeteer

新建一个demo.js,引入puppeteer包,然后配置Chrome的启动路径。调用puppeteer.launch()方法启动Chrome。以下是一个简单的示例。

js 复制代码
const puppeteer = require('puppeteer');
​
async function openWebsite() {
  const browser = await puppeteer.launch({
    //注意:这里配置的就是自己下载的本地Chrome可执行文件的路径
    executablePath: "C:\AppData\Local\Google\Chrome\Application\chrome.exe", 
    //这个配置项的意思是:是否无界面,这里选择有界面,方便调试
    headless: false
  });
​
  const page = await browser.newPage();
  //goto中的参数,选择打算访问的网页,这里选择的是百度
  await page.goto('https://www.iqiyi.com/?vfm=f_588_wrb&fv=ac30238882b84c8c');
​
  await browser.close();
}
​
openWebsite();
相关推荐
None3211 天前
【NestJs】使用Winston+ELK分布式链路追踪日志采集
javascript·node.js
Dilettante2581 天前
这一招让 Node 后端服务启动速度提升 75%!
typescript·node.js
Mr_li2 天前
NestJS 集成 TypeORM 的最优解
node.js·nestjs
UIUV2 天前
node:child_process spawn 模块学习笔记
javascript·后端·node.js
前端付豪3 天前
Nest 项目小实践之注册登陆
前端·node.js·nestjs
天蓝色的鱼鱼3 天前
Node.js 中间层退潮:从“前端救星”到“成本噩梦”
前端·架构·node.js
codingWhat3 天前
uniapp 多地区、多平台、多环境打包方案
前端·架构·node.js
小p3 天前
nodejs学习: 服务器资源CPU、内存、硬盘
node.js
Mr_li3 天前
手摸手,教你如何优雅的书写 NestJS 服务配置
node.js·nestjs
QQ5110082854 天前
python+springboot+django/flask的校园资料分享系统
spring boot·python·django·flask·node.js·php