基于一种基于OCR图像识别技术的发票采集管理系统及方法

本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对发票图片信息数据进行识别读取以获得OCR图像识别结果,发票信息验证处理单元对OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,发票信息分类展示单元对发票信息数据进行分类展示处理,综合地实现发票信息数据的采集、识别、查验、处理与存储的全过程。


1 .一种基于OCR图像识别技术的发票采集管理系统,其特征在于,包括依次连接的发票信息采集单元、OCR图像识别单元、发票信息验证处理单元、发票信息存储管理单元和发票信息分类展示单元,所述发票信息采集单元采集发票图片信息数据,所述OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,所述发票信息验证处理单元对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,所述发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,所述发票信息分类展示单元对所述发票信息存储管理单元存储的发票信息数据进行分类展示处理。

2.根据权利要求1所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所

述发票信息验证处理单元包括互相连接的发票类型鉴定模块和发票信息查验模块,所述发票类型鉴定模块连接在所述OCR图像识别单元和所述发票信息存储管理单元之间,所述发票信息查验模块一端远程连接至税务局增值税发票真伪查验平台同时另一端与所述发票信息存储管理单元相连,所述发票类型鉴定模块对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为非增值税发票时发送至发票信息存储管理单元存储,在鉴别为增值税发票时发送至发票信息查验模块,所述发票信息查验模块在所述发票类型鉴定模块的鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验并在查验为真时发送至发票信息存储管理单元进行重复归集核查和相应存储。

3.根据权利要求2所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息存储管理单元包括相互连接的发票信息重复归集核查模块和发票信息数据库, 所述发票信息重复归集核查模块与发票信息查验模块相连,所述发票信息数据库连接于所述发票类型鉴定模块和所述发票信息分类展示单元之间,发票信息重复归集核查模块接收查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查,所述发票信息数据库接收鉴别结果为非增值税发票的OCR图像识别结果直接进行存储同时接收重复归集核查结果为未重复的增值税发票的OCR图像识别结果进行存储。

4 .根据权利要求1-3之一所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述OCR图像识别单元结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。

5.根据权利要求4所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述OCR图像识别结果为json格式的结构化信息数据。

6.根据权利要求5所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述发票类型鉴定模块基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别。

7 .根据权利要求6所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息采集单元包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式进行发票信息采集。

8.一种基于OCR图像识别技术的发票采集管理方法,其特征在于,所述方法在采集发票图片信息数据后利用OCR图像识别技术结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,再对所述OCR图像识别结果的发票类型进行鉴别,在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验, 当查验结果为真时再对相应的增值税发票的OCR图像识别结果进行重复归集核查,并在核查结果为未重复时将OCR图像识别结果进行相应存储;或,在鉴别结果为非增值税发票时, 对非增值税发票的OCR图像识别结果直接进行存储;然后对发票信息数据进行分类展示处理。

9.根据权利要求8所述的基于OCR图像识别技术的发票采集管理方法,其特征在于, 所述方法在采集发票图片信息数据后利用OCR图像识别技术结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。

相关推荐
xiao5kou4chang6kai46 天前
MATLAB机器学习、深度学习--从数据预处理到模型训练
深度学习·机器学习·matlab·数据预处理
Sour6 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
bubiyoushang8886 天前
电力线信道“五类噪声”仿真MATLAB
开发语言·matlab
cici158746 天前
彩色图像模糊增强(Fuzzy Enhancement)MATLAB 实现
开发语言·算法·matlab
kaikaile19956 天前
图像稀疏化分解 + 压缩感知(CS)重建 MATLAB
开发语言·计算机视觉·matlab
yugi9878386 天前
PNCC(Power-Normalized Cepstral Coefficients)— MATLAB 实现
开发语言·人工智能·matlab
cooldog123pp6 天前
cplex完全安装手册,适配matlab和python!
人工智能·python·matlab·cplex
2zcode6 天前
项目文档:基于MATLAB语音信号变声算法设计与实现
算法·matlab·语音识别
旗讯数字6 天前
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
大数据·ocr
天疆说6 天前
在 Ubuntu 24.04 上安装 MATLAB R2021b
数据库·ubuntu·matlab