在海关日常办公中,每天会接收大量来自企业的进出口报关单据,这些单据多以图片或 PDF 形式呈现,包含商品名称、HS 编码、申报金额、进出口口岸等关键信息,传统人工录入不仅耗时费力,还易因人为失误导致数据偏差,影响通关效率。

今天我们分享快速从图片或者PDF里提取区域文字组合导出表格的方法,具体操作步骤如下
一、操作步骤
-
选择模式 :打开软件,根据文件类型选择 "图片识别模式" 或 "PDF 识别模式"。
-
设置识别区域 :将图片或 PDF 文件拖入软件界面,用鼠标框选需要识别的区域,保存绘制区域的坐标,若有多个区域,可多次绘制并命名,这些名字将作为导出表格的列名。
-
加载文件并处理 :点击 "导入图片" 或 "导入 PDF" 按钮,选择待处理文件所在文件夹,选择 "区域识别导表格" 功能,点击 "开始处理"。
-
校验结果:识别完成后,检查表格内容是否完整、正确,如有错误,可调整识别区域或重新设置参数再次处理。

二、注意事项
文件规格 :该系统适用于固定大小的文档,若文件尺寸不统一,需联系技术动态锁定位置。
识别率影响因素:字体与字号方面,印刷字体识别率较高;文字清晰度、分辨率、背景复杂度等也会影响识别率,如文字有污渍、背景复杂等会降低识别准确率。