本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对发票图片信息数据进行识别读取以获得OCR图像识别结果,发票信息验证处理单元对OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,发票信息分类展示单元对发票信息数据进行分类展示处理,综合地实现发票信息数据的采集、识别、查验、处理与存储的全过程。
1 .一种基于OCR图像识别技术的发票采集管理系统,其特征在于,包括依次连接的发票信息采集单元、OCR图像识别单元、发票信息验证处理单元、发票信息存储管理单元和发票信息分类展示单元,所述发票信息采集单元采集发票图片信息数据,所述OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,所述发票信息验证处理单元对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,所述发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,所述发票信息分类展示单元对所述发票信息存储管理单元存储的发票信息数据进行分类展示处理。
2.根据权利要求1所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所
述发票信息验证处理单元包括互相连接的发票类型鉴定模块和发票信息查验模块,所述发票类型鉴定模块连接在所述OCR图像识别单元和所述发票信息存储管理单元之间,所述发票信息查验模块一端远程连接至税务局增值税发票真伪查验平台同时另一端与所述发票信息存储管理单元相连,所述发票类型鉴定模块对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为非增值税发票时发送至发票信息存储管理单元存储,在鉴别为增值税发票时发送至发票信息查验模块,所述发票信息查验模块在所述发票类型鉴定模块的鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验并在查验为真时发送至发票信息存储管理单元进行重复归集核查和相应存储。
3.根据权利要求2所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息存储管理单元包括相互连接的发票信息重复归集核查模块和发票信息数据库, 所述发票信息重复归集核查模块与发票信息查验模块相连,所述发票信息数据库连接于所述发票类型鉴定模块和所述发票信息分类展示单元之间,发票信息重复归集核查模块接收查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查,所述发票信息数据库接收鉴别结果为非增值税发票的OCR图像识别结果直接进行存储同时接收重复归集核查结果为未重复的增值税发票的OCR图像识别结果进行存储。
4 .根据权利要求1-3之一所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述OCR图像识别单元结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。
5.根据权利要求4所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述OCR图像识别结果为json格式的结构化信息数据。
6.根据权利要求5所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述发票类型鉴定模块基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别。
7 .根据权利要求6所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息采集单元包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式进行发票信息采集。
8.一种基于OCR图像识别技术的发票采集管理方法,其特征在于,所述方法在采集发票图片信息数据后利用OCR图像识别技术结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,再对所述OCR图像识别结果的发票类型进行鉴别,在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验, 当查验结果为真时再对相应的增值税发票的OCR图像识别结果进行重复归集核查,并在核查结果为未重复时将OCR图像识别结果进行相应存储;或,在鉴别结果为非增值税发票时, 对非增值税发票的OCR图像识别结果直接进行存储;然后对发票信息数据进行分类展示处理。
9.根据权利要求8所述的基于OCR图像识别技术的发票采集管理方法,其特征在于, 所述方法在采集发票图片信息数据后利用OCR图像识别技术结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。