paddle表格识别数据制作

数据格式

其中主要数据有两个一个表格结构的检测框,一个是tokens,注意的地方是

1、只能使用双引号,单引号不行

2、使用带引号的地方是tokens里面

bash 复制代码
 "<tr>", "<td", " colspan='2'", ">",
 " rowspan='2'",

3、tokens里面要有内容,这里放的是"的",为啥呢?因为按照前面的改动没有效果,现在修改后看看效果

例子

bash 复制代码
{
    "filename": "4_2_折页带表格-06.jpg",
    "html": {
        "structure": {
            "tokens": [
                "<tbody>",
                "<tr>",
                "</td>",
                "</tr>",
                "</tbody>",
                "</table>"
            ]
        },
        "cells": [
            {
                "tokens": [
                    "被",
                    "保",
                    "保",
                    "单",
                    "年",
                    "度"
                ],
                "bbox": [
                    [
                        31,
                        12
                    ],
                    [
                        414,
                        11
                    ],
                    [
                        414,
                        121
                    ],
                    [
                        31,
                        121
                    ]
                ]
            },
           
                ]
            }
        ]
    },
    "gt": "<tbody><tr><td>被保险人身故或\n全残时的保单年度</td><td>系数</td></tr><tr><td>首个保单年度</td><td>1</td></tr><tr><td>第二个及以后\n各保单年度</td><td>(1+2.5%)(n-1),其中n为被保险人\n身故或全残时的保单年度数</td></tr></tbody>"
}
相关推荐
牛奶26 分钟前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶28 分钟前
前端人为什么要学AI?
前端·人工智能·ai编程
Kagol3 小时前
🎉OpenTiny NEXT-SDK 重磅发布:四步把你的前端应用变成智能应用!
前端·开源·agent
GIS之路4 小时前
ArcGIS Pro 中的 notebook 初识
前端
JavaGuide4 小时前
7 道 RAG 基础概念知识点/面试题总结
前端·后端
ssshooter5 小时前
看完就懂 useSyncExternalStore
前端·javascript·react.js
格砸5 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
Live000006 小时前
在鸿蒙中使用 Repeat 渲染嵌套列表,修改内层列表的一个元素,页面不会更新
前端·javascript·react native
柳杉6 小时前
使用Ai从零开发智慧水利态势感知大屏(开源)
前端·javascript·数据可视化