将PDF流使用 canvas 绘制然后转为图片展示在页面上(二)

将PDF流转为图片展示在页面上

使用 pdfjs-dist 库来渲染 PDF 页面到 canvas 上,然后将 canvas 转为图片

安装 pdfjs-dist 依赖

bash 复制代码
npm install pdfjs-dist
或者
yarn add pdfjs-dist

创建一个组件来处理 PDF 流的加载和渲染

该组件中是一个包含 PDF 文件的 ArrayBuffer 或者 Uint8Array。

将 pdf 流传入该组件中使用

javascript 复制代码
/** @format */

import React, { useState, useEffect } from 'react';
// import { pdfjs } from 'pdfjs-dist';
var pdfjs = require('pdfjs-dist/es5/build/pdf.js');
pdfjs.GlobalWorkerOptions.workerSrc = `//cdnjs.cloudflare.com/ajax/libs/pdf.js/${pdfjs.version}/pdf.worker.min.js`;

const PdfToImage = ({ pdfData }) => {
    const [imageSrc, setImageSrc] = useState(null);

    const base64ToArrayBuffer = (base64) => {
        var binary_string = window.atob(base64);
        var len = binary_string.length;
        var bytes = new Uint8Array(len);
        for (var i = 0; i < len; i++) {
            bytes[i] = binary_string.charCodeAt(i);
        }
        return bytes.buffer;
    };

    useEffect(() => {
        const renderPDF = async (arrayBuffer) => {
            const loadingTask = pdfjs.getDocument({ data: arrayBuffer });

            try {
                const pdf = await loadingTask.promise;
                const page = await pdf.getPage(1); // 获取第一页
                const viewport = page.getViewport({ scale: 1.5 }); // 设置缩放比例
                const canvas = document.createElement('canvas');
                const canvasContext = canvas.getContext('2d');
                canvas.height = viewport.height;
                canvas.width = viewport.width;

                const renderContext = {
                    canvasContext,
                    viewport,
                };
                await page.render(renderContext).promise;

                // 将canvas内容转换为图片
                const imageSrc = canvas.toDataURL('image/png');
                setImageSrc(imageSrc);
            } catch (error) {
                console.error('Error rendering PDF:', error);
            }
        };

		// 首先将base64的PDF流转为ArrayBuffer
        let arrayBuffer = base64ToArrayBuffer(pdfData);
		// 然后将ArrayBuffer格式的数据转为图片
        renderPDF(arrayBuffer);
    }, [pdfData]);

    return <div>{imageSrc && <img src={imageSrc} alt="PDF as image" />}</div>;
};

export default PdfToImage;

使用示例

这里的PDF_content 也可以直接使用 ArrayBuffer 或者 Uint8Array 的格式,直接传入组件,将组件中的 base64ToArrayBuffer 方法不使用即可。

javascript 复制代码
import React from 'react';
import PdfToImage from './PdfToImage.jsx';
 render() {
 const PDF_content = 'XXXX....BYFhEdCmVuZHN0cmVhbQplbmRvYmoKc3RhcnR4cmVmCjg2NTkxCiUlRU9GCg=='// base64 格式
  return (
  	<PdfToImage  pdfData={PDF_content}></PdfToImage>
  )
 }
相关推荐
Richown11 分钟前
全链路追踪:OpenTelemetry与Jaeger实战
区块链·react
XinZong25 分钟前
OpenClaw 实现双重心跳(Heartbeat)+ clawreach虾聊项目实现
javascript
IT_陈寒1 小时前
Redis缓存击穿把我整不会了,原来还有这手操作
前端·人工智能·后端
idcu2 小时前
深入 Lyt.js 组件系统:L2 渲染引擎层的核心
前端·typescript
这是程序猿2 小时前
Spring Boot自动配置详解
java·大数据·前端
文心快码BaiduComate2 小时前
干货|Comate Harness Engineering工程实践指南
前端·后端·程序员
还有多久拿退休金2 小时前
一张栈的图,治好你面试答不出 script 阻塞的病
前端·javascript
光辉GuangHui2 小时前
Agent Skill 也需要测试:如何搭建 Skill 评估框架
前端·后端·llm
To_OC2 小时前
我终于搞懂 Claude Code 核心逻辑!90%的人都用错了模式
前端·ai编程
蓝宝石的傻话2 小时前
Headless浏览器的隐形陷阱:为什么你的AI自动化工具抓不到页面早期错误?
前端