puppeteer截图实现备忘

安装好node之后,随便找个文件夹,执行node init 初始化一个项目。然后在当前项目下创建.npmrc 可以配置国内源

js 复制代码
registry=https://registry.npm.taobao.org

如果安装后抓取的页面中文没有显示出来或者乱码,那么需要安装一个字体文件,下面的是centos下的操作,随便找个中文字体就行。

#Puppeteer 出现部分中文显示乱码

shell 复制代码
shell sudo yum install wqy-microhei-fonts.noarch -y
sudo yum install wqy-unibit-fonts.noarch -y 
sudo yum install wqy-zenhei-fonts.noarch -y

Failed to launch the browser process! without --no-sandbox is not supported

遇到这个错误,启动的时候加上下面这俩参数即可。

js 复制代码
puppeteer按错信息如下:  
Error: Failed to launch the browser process!  
  
[0805/102322.965291:ERROR:zygote_host_impl_linux.cc(90)] Running as root without --no-sandbox is not supported. See <https://crbug.com/638180.>  
  
TROUBLESHOOTING: <https://github.com/puppeteer/puppeteer/blob/main/docs/troubleshooting.md>  
  
解决方案:await puppeteer.launch({args: ['--no-sandbox', '--disable-setuid-sandbox']});  
  
puppeteer-issues-290

# Linux-Centos7安装puppeteer(避免所有的坑)

# Puppeteer环境搭建的详细步骤

PhantomJS

这个比较早啦,有些页面的现代css样式可能无法正确抓取

pp如何使用 PHP 实现网页快照和页面截图功能

相关推荐
树獭叔叔12 小时前
从RLHF到PPO:让AI学会说人话
后端·aigc·openai
Meepo_haha12 小时前
创建Spring Initializr项目
java·后端·spring
Memory_荒年12 小时前
SpringBoot事务源码深度游:从注解到数据库的“奇幻漂流”
java·后端·spring
编码忘我12 小时前
为什么要用SpringBoot
java·后端
Memory_荒年12 小时前
SpringBoot事务:从“一键开关”到“踩坑大全”的生存指南
java·后端·spring
PFinal社区_南丞12 小时前
一文讲透 .trae 文件夹 - Trae IDE 配置指南和最佳实践
后端
段小二13 小时前
Spring AI Agent 完整实战:Function Calling + RAG + Memory + SafeGuard 构建机票助手
后端
编码忘我13 小时前
Spring源码又看了一遍
后端
希望永不加班13 小时前
SpringBoot 主启动类解释:@SpringBootApplication 到底做了什么
java·spring boot·后端·spring
一只叫煤球的猫13 小时前
为什么不用 RAG 做记忆系统 ——压缩上下文与 memory.md 的架构选择
人工智能·后端·ai编程