人工智能结合模板实现表格信息提取

人工智能结合模板实现表格信息提取

一、 项目介绍

本项目基于是OCR(文本识别)、表格识别的人工智能技术应用,通过表格识别,实现快速制作模板;模板单元格信息,结合OCR识别结果,将表格内容提取为结构化信息输出。与KIE(Key Information Extraction,关键信息抽取)模型对比,本项目准确率更高,效率更快,占用资源更小,能大大提升用户将非结构化的数据转化为结构化数据的质量。

二、技术要点

  • PaddleOCR,百度飞桨开源的OCR文字识别工具库
  • Table Detection,基于Cycle-CenterNet的表格识别
  • OpenCV,开源、跨平台的计算机视觉库

三、视频展示

四、操作流程

制作模板

  • 运行模板制作工具WlkrLabel
  • 文件 -> 打开,选择模板所在路径文件夹
  • 人工智能 -> 表格检测
    • Anchor锚点,用于定位表格,修正图片偏移,适用于如扫描件、照片等,减少因图片位置偏移带来的错误
    • 单元格Region,适合文字居中的情况
    • 文字Region,适合文字非居中的情况
  • 选中的蓝色单元,为程序推理得出的锚点,其他颜色单元格则为与锚点一一配对的待提取内容
  • 检查模板,由于无法做到100%准确,需要手动修正,如删除多余单元格,修正错误字等
  • 确认模板无误后,点击右下角"确认"按钮
  • 对于空白表单也能识别,但是效果会稍差
  • 完成所有图片模板的制作后,按Ctrl + S保存结果(或者 文件 -> 导出标记结果)

上传模板

  • 使用系统api接口更新模板,
  • 选中模板文件夹内的Label.txt及相关图片
  • 将所有文件上传到系统。

测试效果

  • 试用地址:表格信息提取 - 模板识别
  • 试用地址中提供了两种方式测试
  • 一是下载Excel,自行填充内容,导出图片后,旋转角度测试
  • 二是直接下载0°与180°两张示例图,用于测试
  • 下面为旋转180°的识别效果
相关推荐
一切皆是因缘际会10 小时前
2026年AGI突围:自主智能体驱动,数字生命从架构落地到自我迭代全解析
人工智能·深度学习·机器学习·架构·系统架构·agi
Mr数据杨10 小时前
【CanMV K210】音频实验 I2S 数字麦克风与 FFT 频谱可视化
人工智能·音视频·硬件开发·canmv k210
国产电子元器件10 小时前
ACS758国产替代方案有哪些?工程师如何选择霍尔电流传感器
人工智能
AI棒棒牛10 小时前
RT-DETR最新创新改进系列:2D轻量解码结构重塑检测颈部,减少下采样链路,降低计算冗余,让端到端检测更快更轻!【轻装上阵,实时优先】
人工智能·深度学习·目标检测·计算机视觉·rt-detr
陆水A10 小时前
运输时效预测模型:静态路由时效的计算与验证
大数据·人工智能·算法·spark·数据库开发·etl工程师
小小AK10 小时前
旺店通与金蝶云星空系统对接方案
人工智能
冰西瓜60010 小时前
深度学习的数学原理(三十四)—— Transformer 解码器完整实现
人工智能·深度学习·transformer
央链知播10 小时前
中国移联AI元宇宙产业委调研阿尔特汽车科技园 构建高精尖产业的“技术-场景-商业”融合生态
人工智能·汽车·业界资讯
2601_9494999410 小时前
芯瑞科技400G VR4 OSFP光模块:赋能AI智算中心,破解算力互联痛点
人工智能·科技
扬帆破浪10 小时前
免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:本地离线知识库的真完全离线 内网无外网装察元AI的拼装步骤
人工智能·windows·开源·电脑·知识图谱