TextIn OCR Frontend前端开源组件库发布!

🔔为什么开源 TextIn OCR Frontend 前端组件库?

在 TextIn 社群中,我们时常接到用户反馈,调取 API 进行票据等文件批量识别后,需要另行完成前端工程,实现比对环节。为助力用户节省工程成本,TextIn 团队正式开源 OCR Frontend 前端组件库,便于用户搭建前端界面,完成识别结果审核,提升使用体验。

此外,对于有翻译、校对等需求的开发者,也可灵活应用开源组件库,进行二次开发。

TextIn OCR Frontend 是一个用于展示 Textin 识别结果的 React 组件库,支持文件预览、坐标回显和结果展示。

组件库适配票据类解析结果(key-value)的展示,前端界面案例见下图。

特性

  • 📄 支持图片和 PDF 文件预览

  • 🎯 支持文本区域坐标回显和高亮

  • 🔄 预览区域和识别结果双向联动

  • 📊 支持 JSON 格式结果展示

  • 🎨 TODO:可自定义样式和主题

安装与使用

拉取项目

快速开始

组件说明

1. FilePreview 文件预览组件

文件预览组件,支持 PDF 和图片预览,支持缩放、旋转、分页等功能。

Props

2. ResultView 结果展示组件

结果展示组件,支持表格和列表两种展示方式。

Props

3. MarkLayer 标注层组件

标注层组件,用于在图片显示标注框。

Props

4. JsonView JSON 展示组件

JSON 数据展示组件,用于格式化展示 JSON 数据。 本项目 JSON 数据采用react-json-view库渲染,API 保持一致,详细属性可参考其官方文档。

Props

API Interface 定义

PDFSrc

PDF 文件源配置

IRectItem

标注框数据

IPageItem

页面数据

IResultListItem

结果列表项

IFieldItem

字段项

ToolbarOptions

工具栏配置

PreviewToolItem

工具栏配置项

Hooks

useContentLinkage

用于实现预览区域和识别结果的双向联动。

参数

返回值

usePDFMarkLayer

用于在 PDF 文档上实现标注层功能。

参数

返回值

usePreviewTool

用于实现预览工具栏功能,包括缩放、旋转和 1:1 还原。

参数

返回值

示例

图片示例

PDF 示例

二次开发

项目基于 vite 和 react 构建,您可将该项目 fork 到本地自主扩展: 拉取项目

以上为 TextIn OCR Frontend 开源组件库当前版本介绍。根据规划,组件库将持续迭代,实现:

  • 组件支持更多自定义配置、样式覆盖等特性

  • 支持可编辑、复制、导出结果

  • 支持更多复杂类型识别结果展示

使用过程中如有任何问题,欢迎后台私信小助手,在 TextIn 社群与我们技术团队的小伙伴交流探讨!

相关推荐
CoderIsArt5 分钟前
CORDIC三角计算技术
人工智能·算法·机器学习
立志成为大牛的小牛5 分钟前
数据结构——二十九、图的广度优先遍历(BFS)(王道408)
数据结构·数据库·学习·程序人生·考研·算法·宽度优先
taxunjishu5 分钟前
Ethernet/ip 转 Modbus RTU 驱动,罗克韦尔 PLC 与华为逆变器打造光伏电站智能监控典范
人工智能·物联网·自动化·区块链
Alex艾力的IT数字空间7 分钟前
基于PyTorch和CuPy的GPU并行化遗传算法实现
数据结构·人工智能·pytorch·python·深度学习·算法·机器学习
byte轻骑兵8 分钟前
时序数据库选型指南:从大数据视角看Apache IoTDB的核心优势
大数据·时序数据库
仰泳的熊猫18 分钟前
LeetCode:51. N 皇后
数据结构·c++·算法·leetcode
独自破碎E20 分钟前
LeetCode 381: O(1) 时间插入、删除和获取随机元素 - 允许重复
java·算法·leetcode
却道天凉_好个秋22 分钟前
OpenCV(十三):通道的分离与合并
人工智能·opencv·计算机视觉
七宝大爷28 分钟前
NVIDIA Blackwell Ultra GB300深度解析:AI芯片性能的新巅峰
人工智能·gpu·gb300
鲸鱼在dn29 分钟前
大语言模型的后训练与“灾难性遗忘”问题——李宏毅2025大模型第六讲笔记
人工智能·笔记·语言模型