python ofd转pdf及图片

本文部分内容参考,如有侵权请联系删除:使用 easyofd 解析ofd 文件_python模块easyofd如何使用-CSDN博客

背景需求:需要将邮箱中得ofd格式发票提取出来转换成pdf或者图片。

在网上搜了发现使用pyofd包,安装之后使用各种问题,所以在PyPi上找了下发现包不多,最新得是easyofd,并且开发者最新还在更新,所以果断转到easyofd包上来,但是这块有一个很重要得必坑得就是最好从github上下载最新得包安装并使用,要不然版本不对还是会报错。开始由于版本不对,参考博客内容运行,发现有问题,于是看引用发现版本不对,所以最好还是用最新得,我这版是:, 下载地址:

https://github.com/renoyuan/easyofd

运行代码如下:

python 复制代码
import requests
import urllib
from PIL import Image
from easyofd.ofd import OFD
import base64

def ofd_to_images(ofd_path, images_path, filename):
    with open(ofd_path + filename,"rb") as f:
        ofdb64 = str(base64.b64encode(f.read()),"utf-8")
        ofd = OFD() # 初始化OFD 工具类
        ofd.read(ofdb64,save_xml=False, xml_name="testxml") # 读取ofdb64
        # print(ofd.data) # ofd.data 为程序解析结果
        img_np = ofd.to_jpg() # 转图片

        for idx, img in enumerate(img_np):
            im = Image.fromarray(img)
            im.save(f'%s.png' % (images_path + filename[:-4], ))

def ofd_to_pdf(ofd_path, images_path, filename):
    with open(ofd_path + filename,"rb") as f:
        ofdb64 = str(base64.b64encode(f.read()),"utf-8")
        ofd = OFD() # 初始化OFD 工具类
        ofd.read(ofdb64,save_xml=False, xml_name="testxml") # 读取ofdb64
        # print(ofd.data) # ofd.data 为程序解析结果
        pdf_bytes = ofd.to_pdf() # 转pdf
   
        with open(f'%s.pdf' % (images_path + filename[:-4], ), "wb") as f:
            f.write(pdf_bytes)

if __name__ == "__main__":
    # 将ofd转成pdf
    ofd_to_pdf(ofd_file_folder, pdf_file_folder, filename)
    # 将ofd转成images
    ofd_to_images(ofd_file_folder, img_file_folder, filename)
相关推荐
棉猴5 分钟前
Pygame中实现图像旋转效果-应用2-1
python·pygame·游戏编程·图像旋转·rotate
依米s5 分钟前
Pycharm 、IDEA卡顿问题解决方案
ide·python·性能优化·pycharm
爱学习的徐徐40 分钟前
Python 豆瓣TOP250 爬虫类讲解
爬虫·python
老歌老听老掉牙43 分钟前
SymPy 绘图完全指南:从基础到高级应用
python·绘图·sympy
小白学大数据1 小时前
Python爬虫技术:招标信息抓取与关键词过滤 (1)
开发语言·爬虫·python
电商API_180079052472 小时前
获取淘宝商品视频API接口解析:通过商品链接url获取商品视频item_video
开发语言·爬虫·python·数据挖掘·数据分析
精灵vector2 小时前
构建自定义AI客户支持助手——LangGraph 中断机制
人工智能·python
用户8356290780512 小时前
使用Python自动化移除Excel公式,保留纯净数值
后端·python
Pocker_Spades_A2 小时前
Python快速入门专业版(五十):Python异常处理:try-except语句(捕获单一与多个异常)
开发语言·python
精致先生2 小时前
多模态PDF解析
pdf·大模型·rag