paddle表格识别数据制作

数据格式

其中主要数据有两个一个表格结构的检测框,一个是tokens,注意的地方是

1、只能使用双引号,单引号不行

2、使用带引号的地方是tokens里面

bash 复制代码
 "<tr>", "<td", " colspan='2'", ">",
 " rowspan='2'",

3、tokens里面要有内容,这里放的是"的",为啥呢?因为按照前面的改动没有效果,现在修改后看看效果

例子

bash 复制代码
{
    "filename": "4_2_折页带表格-06.jpg",
    "html": {
        "structure": {
            "tokens": [
                "<tbody>",
                "<tr>",
                "</td>",
                "</tr>",
                "</tbody>",
                "</table>"
            ]
        },
        "cells": [
            {
                "tokens": [
                    "被",
                    "保",
                    "保",
                    "单",
                    "年",
                    "度"
                ],
                "bbox": [
                    [
                        31,
                        12
                    ],
                    [
                        414,
                        11
                    ],
                    [
                        414,
                        121
                    ],
                    [
                        31,
                        121
                    ]
                ]
            },
           
                ]
            }
        ]
    },
    "gt": "<tbody><tr><td>被保险人身故或\n全残时的保单年度</td><td>系数</td></tr><tr><td>首个保单年度</td><td>1</td></tr><tr><td>第二个及以后\n各保单年度</td><td>(1+2.5%)(n-1),其中n为被保险人\n身故或全残时的保单年度数</td></tr></tbody>"
}
相关推荐
小二·1 小时前
Python Web 开发进阶实战:无障碍深度集成 —— 构建真正包容的 Flask + Vue 应用
前端·python·flask
niucloud-admin9 小时前
web 端前端
前端
胖者是谁12 小时前
EasyPlayerPro的使用方法
前端·javascript·css
EndingCoder12 小时前
索引类型和 keyof 操作符
linux·运维·前端·javascript·ubuntu·typescript
liux352812 小时前
Web集群管理实战指南:从架构到运维
运维·前端·架构
沛沛老爹12 小时前
Web转AI架构篇 Agent Skills vs MCP:工具箱与标准接口的本质区别
java·开发语言·前端·人工智能·架构·企业开发
小光学长13 小时前
基于Web的长江游轮公共服务系统j225o57w(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
前端·数据库
Joe55614 小时前
vue2 + antDesign 下拉框限制只能选择2个
服务器·前端·javascript
ChangYan.15 小时前
monorepo 多包管理识别不到新增模块,解决办法
前端·chrome
Jinuss15 小时前
React元素创建介绍
前端·react.js