Linux系统无头浏览器pupteer截图出来中文乱码

无头浏览器 Puppeteer 截图出现中文乱码(通常显示为方块或缺失字符),根本原因在于 Linux 服务器默认缺少中文字体库。Puppeteer 使用的 Chromium 浏览器无法渲染中文,是因为系统未安装支持中文的字体。


解决方案

根据公开资料,主流解决方式如下:

  • 安装中文字体到服务器
  • 更新字体缓存
  • (可选)在 Puppeteer 启动参数中指定中文字体

具体操作步骤(适用于 CentOS / Ubuntu / AliLinux 等)

  1. 安装 fontconfig(如未安装)

    bash 复制代码
    CentOS/RHEL
    yum install -y fontconfig
    
    Ubuntu/Debian
    apt-get update && apt-get install -y fontconfig
  2. 从 Windows 系统复制中文字体到服务器

    • 常用中文字体文件(位于 C:\Windows\Fonts\):

      • simsun.ttc(宋体)
      • msyh.ttc(微软雅黑)
      • simhei.ttf(黑体)
    • 将这些字体文件上传至服务器的 /usr/share/fonts/chinese/ 目录(若目录不存在则创建):

      bash 复制代码
      mkdir -p /usr/share/fonts/chinese
      通过 scp、rz 或其他方式上传字体文件至此目录
  3. 设置字体目录权限

    bash 复制代码
    chmod -R 755 /usr/share/fonts/chinese
  4. 刷新字体缓存

    bash 复制代码
    fc-cache -fv
  5. 验证中文字体是否安装成功

    bash 复制代码
    fc-list :lang=zh

    若输出包含 SimSunMicrosoft YaHei 等字体,则表示安装成功。

  6. (可选)在 Puppeteer 启动参数中指定字体

    在代码中添加 --font-family 参数,例如:

    js 复制代码
    const browser = await puppeteer.launch({
      headless: 'new',
      args: [
        '--no-sandbox',
        '--font-family=SimSun' // 指定默认中文字体
      ]
    });

Docker 部署场景

若使用 Docker 部署,可在 Dockerfile 中直接复制字体并安装:

dockerfile 复制代码
FROM node:18-alpine

安装 Chromium 依赖和中文字体
RUN apk add --no-cache \
    chromium \
    nss \
    freetype \
    ttf-liberation \
    wqy-zenhei \
    font-noto-cjk \
    fontconfig

复制中文字体(假设已将 msyh.ttc 放在本地目录)
COPY msyh.ttc /usr/share/fonts/

更新字体缓存
RUN fc-cache -fv

设置 Puppeteer 使用系统 Chromium
ENV PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=true \
    PUPPETEER_EXECUTABLE_PATH=/usr/bin/chromium-browser

... 其他配置
总结

- 根本原因:Linux 服务器无中文字体。
- 核心解决:安装中文字体 + 运行 `fc-cache -fv`。
- 推荐字体:`SimSun`、`Microsoft YaHei`、`WenQuanYi Zen Hei`。
- 验证命令:`fc-list :lang=zh`。

完成上述操作后,Puppeteer 截图中文乱码问题即可解决。
相关推荐
2401_834636991 小时前
Linux 负载均衡全实战:Nginx+HAProxy+LVS 从原理到落地
linux·nginx·负载均衡
鹏大师运维6 小时前
为什么信创电脑装软件总提示“软件包架构不匹配”?
linux·运维·架构·国产化·麒麟·deb·统信uos
007张三丰6 小时前
软件测试专栏(11/20):测试框架开发:pytest深度解析与插件体系
运维·服务器·自动化测试·pytest·测试框架
weixin_604236677 小时前
华三 路由器 极简核心配置
运维·服务器·网络·h3c·h3c路由器
鹤落晴春8 小时前
【Linux复习】管理SELinux安全性
linux·运维·服务器
yz_aiks8 小时前
Linux Jar包配置Systemd自启动实战:从排查到配置全流程
linux·python·jar·自启动·systemd
AI智图坊8 小时前
多件装组合SKU图的批量生产效率分析:从PS手工到AI自动化的工作流改造
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
bjzhang7510 小时前
CentOS下安装MySQL详解
linux·mysql·centos
Jason_chen11 小时前
Linux 6.2 音频机制深度解析:AI驱动的低延迟音频与零信任音频安全架构
linux
下午写HelloWorld11 小时前
Linux系统及Ubuntu常用指令
linux·ubuntu·操作系统