table 接口返回的数据结构(简化版)
json
{
"html_text": "<table>...</table>", // 渲染用的 HTML
"html_logi": [[行,列,行,列], ...], // 逻辑行列映射(哪个格子属于哪行哪列)
"html_bbox": [[x1,y1,x2,y2,...], ...] // 每个格子的像素坐标 [x1,y1,x2,y2,x3,y3,x4,y4]
}
三个字段各管什么
| 字段 | 作用 | 示例 |
|---|---|---|
html_text |
给前端渲染的完整 HTML | <table><tr><td>莲白</td>... |
html_logi |
逻辑结构:每个格子的行号、列号 | [2, 2, 3, 3] = 第2行第3列 |
html_bbox |
物理位置:每个格子在图片上的8个坐标点 | [120,662,621,662,621,728,120,728] |
实际数据长什么样(只看数据行)
| 序号 | 类别 | 品名 | 单位 | 重量 | 折扣 | 实付 | 备注列 |
|---|---|---|---|---|---|---|---|
| 16 | 蔬菜 | 绿豆芽 | 斤 | 3.6 | 78% | 2.78 | |
| 17 | 蔬菜 | 茄子 | 斤 | 6.2 | 78% | 4.8 | |
| 48 | 蔬菜 | 青椒 | 斤 | 5.8 | 78% | 4.5 | |
| ... | ... | ... | ... | ... | ... | ... | |
| 62 | 水产 | 花鲢 | 斤 | 18.2 | 78% | 14.2 | |
| 重庆贻农汇...代表 | |||||||
| 合川区消防...代表 |
底部是签字栏,无结构化数据。
一句话总结
html_logi管 "这是第几行第几列" ,html_bbox管 "这格子在图上哪个位置" ,html_text管 "画出来长啥样"。