表格结构识别与内容解析——基于Cascade R-CNN的表格行、列、单元格自动检测与分类_1该数据集是RF100计划的一部分,由Intel赞助,旨在创建用于模型泛化能力评估的新型目标检测基准。数据集以表格结构识别为核心,包含3866张图像,所有图像均以YOLOv8格式进行了详细标注。数据集涵盖12种类别,包括普通行、加粗行、父行、子行、列、父列、主父元素、闭合行等表格结构元素。这些标注能够精确识别表格中的各种结构关系,如直接父子关系、非直接父子关系等。数据集通过qunshankj平台导出,未应用任何图像增强技术,保持了原始数据的完整性。该数据集为表格结构理解、文档解析和信息提取等计算机视觉任务提