poocr解锁1s识别发票解析

poocr解锁1s识别发票解析

poocr是基于腾讯云 OCR 接口的 Python 第三方库,通过二次封装将很多的复杂场景(身份证、发票、车牌等)的识别简化为「1 行代码」,支持图片 / URL 输入,兼容本地文件与在线图片,识别z准确率非常高。

1. 需求

最近有个需求,需要识别购车发票中的信息,然后将识别到的内容保存在excel表格中保存。找了网上很多的开源项目之后,发现poocr这个库非常的好用,于是决定在poocr这个库中添加功能,该功能可以识别图片中的指定类型的发票。

2. 前期准备

2.1 代码准备

  1. 查看poocr源码 点击poocr查看gitcode的代码仓。
  2. fork一个自己的代码仓
  1. 拉取代码

2.2 腾讯云接口

  1. 访问文字识别界面 点击文字识别进入腾讯云文字识别界面。
  2. 查看腾讯云OCR识别功能

点击试用 -> 立即体验即可体验OCR识别功能。

  1. 开通功能并且领去免费试用机会 搜索 文字识别,往下拉,点击开始使用。需要开通后付费设置免费使用机会才可以生效。
  1. 生成密钥ID和Key

点击新建密钥可以自动生成密钥,最多两个哦。

3. 功能实现

3.1 查看代码示例

从官方文档可知,调用腾讯云API时,首先需要有SecretIdSecretKey,对应上面申请的密钥;其次,在调用时需要使用models创建一个RecognizeGeneralInvoiceRequest的请求对象,使用这个封装请求的参数对象;最后,发送请求时,使用client调用RecognizeGeneralInvoice发送接口获取调用的结果。 可以看出有两个参数是我们在使用过程中需要的:

  • ImageBase64: 图片的 Base64 值。
  • ImageUrl: 图片的 Url 地址。

注意:

  1. 支持的图片格式为PNG、JPG、JPEG、PDF,不支持 GIF 格式。 2. 支持的图片不超过 10M。 3. 图片下载时间不超过 3 秒。 4. 支持的图片像素:单边介于20-10000px之间。 5. 图片的 ImageUrl、ImageBase64 必须提供一个,如果都提供,只使用 ImageUrl。 6. 图中的`Types`参数如果指定,图片中的所有发票会按照你指定的类型来识别,而不是只识别图片中指定类型的发票。

3.2 查看poocr代码

从poocr代码结构中可知,api目录下的ocr2excel.py文件中,封装各种识别生成excel的方法。ocr.py文件中封装了各种识别生成json数据的方法。OCR.py文件中,通过models生成请求和client对腾讯云api主要调用方法的实现。

3.3 具体实现

ocr2excel.py添加RecognizeGeneralInvoiceOCR2Excel方法,用于识别发票识别并且生成Excel文件,类别需要在接口文档中查看。

  1. 判断文件或者文件夹是否存在;
  2. 判断输出Excel路径是否合法;
  3. 批量识别图片,根据识别结果生成excel;

ocr.py添加RecognizeGeneralInvoice方式,用于识别发票返回识别图片中的所有的json数据。

4. 功能测试

需要识别图片中火车票的数据并且生成Excel文件。 代码执行结果: 识别结果:

相关推荐
GetcharZp1 小时前
玩转 Linux 机器视觉:手把手带你搞定 Ubuntu 下海康工业相机 C++ SDK
后端
冬奇Lab4 小时前
每日一个开源项目(第133篇):EchoBird - 把 AI 工具的安装和部署做成傻瓜操作
人工智能·开源·资讯
星星在线4 小时前
MusicFree:一个「All in One」的个人音乐服务器,让听歌回归简单
前端·后端
IT_陈寒5 小时前
Redis的SETNX并发问题让我加了三天班
前端·人工智能·后端
demo007x5 小时前
Docling 文档转换以及技术架构分析
前端·后端·程序员
袋鱼不重7 小时前
我的神奇同事,AI 用多了居然写了个 Open In Codex
前端·后端·ai编程
用户8356290780517 小时前
使用 Python 操作 Word 内容控件
后端·python
像我这样帅的人丶你还7 小时前
啥? 前端也要会干Java?🛵🛵🛵
后端
Hommy887 小时前
【剪映小助手】添加贴纸接口(Add Sticker)
后端·github·剪映小助手·视频剪辑自动化·剪映api
CaffeinePro8 小时前
FastAPI响应处理:返回值、状态码、响应头与异常标准化与案例解析
后端