合合信息OCR支持30类国内常见票据一站式分类识别,支持医疗发票、数电票识别

合合信息TextIn平台明星产品------国内通用票据识别,重磅更新!

产品支持票据类型扩展到23大类、30小类,覆盖场景更全面,同时升级优化了多款票据识别模型,平均识别率较前版本提升11.5%,整体识别速度提升21.9%,识别更快更精准。

▶ 支持多种票据类型

国内通用票据识别依托合合信息多年积累的票据文字OCR识别能力,可识别包含增值税发票、医疗发票、数电票、火车票、出租车发票、飞机行程单、网约车行程单等在内的23大类、30小类国内通用票据,提取其中的信息,并以整理成标准结构化的Key/Value形式返回或导出。

· 医疗票据

国内通用票据识别支持电子医疗发票、纸质门诊发票、纸质住院发票的识别与信息抽取,兼容多种地区版式,精准识别复杂表格信息,助力医保报销、健康险理赔流程自动化。

· 数电票

全面数字化的电子发票(数电票)是与纸质发票具有同等法律效力的新型发票。2022年,国票信息发票通企业数字化税务协同管理平台全新升级数电票功能。2023年12月,数电票试点覆盖到西藏,彻底覆盖全部省/直辖市。

国内通用票据识别支持增值税电子普通发票、增值税电子专用发票、铁路电子客票、航空运输电子客票行程单、区块链电子发票等数电票的票面信息识别,为不满足乐企系统(数电票管理平台)接入条件的小微企业的财务数字化、自动化转型提供有力支持。

▶ 支持多种票据格式

国内通用票据识别支持识别jpg、png、bmp、tiff等多种通用图片格式,以及PDF、OFD格式。

其中,OFD格式作为我国电子学会牵头制定的国家标准,于2009年首次发布,2020年被指定为"增值税电子普通发票"标准文件格式。国内通用票据识别支持全票种多页OFD格式,为有强自动化、批处理需求的用户提供更好的体验。

· 自动分类票种

票据识别OCR多用于报销或审核场景,但具体票据类别难以预测。传统的票据分类方法通常针对某一票面提供单一的API接口,在高吞吐量、多票面场景下难以应对。国内通用票据识别经过深度优化,提供单接口调用服务,自动分类票种并返回识别结果,大幅简化集成难度。用户上传票据时无需手动选择类型,直接上传票据图像,系统即可智能识别类型。

· 图像智能处理,混贴切分

企业报销场景中,常常要求将报销票据黏贴在一页A4纸上。面对混贴多张票据的图像,国内通用票据识别可清晰区分票据,自动切边提取票面信息,智能识别票据类型,便捷切换展示分类识别结果,支持多类票据批量上传、混合扫描、切图、分类、识别。同时对旋转、角度不正的票据图像,也可自动旋转矫正图像,不影响识别效果。

▶ 产品亮点

**· 识别准确率高:**针对各类票据的打印方式和字体进行专项优化,对针式打印、油墨略微污损的文字提供更高的识别准确率。全票种平均识别率94%以上,增值税发票、电子医疗发票、数电票等常用票种平均识别率可达97%以上。

**·识别速度快:**平均0.6秒即可完成单次识别。

**·适用范围广:**支持23大类、30小类的国内主流通用票据类型,支持jpg、png、pdf、ofd等多种文件格式,支持单页、多页文件上传,能满足各类业务场景需求。

**·简易集成:**标准化API接口,支持智能分类,无需手动指定。

多种方式灵活部署

国内通用票据识别支持私有化部署、公有云API等多种部署方式,提供前端识别预览和标准化JSON结果。

传统OCR服务中,支持私有化服务的产品往往无法在线试用,而能在线试用的产品又难以原样部署到本地,导致在项目或业务中的不同阶段,验证OCR服务的性能和能力边界变得困难。

合合信息TextIn产品系列采用多端同步引擎架构,**确保在线SaaS服务版本与私有化版本的引擎一致性,保障两者提供几乎一致的识别率和性能表现,让在线验证、线下部署成为可能。**私有化部署支持CPU、GPU环境及国产化操作系统部署。

同时,SaaS版本和私有化版本还可以简单构成混合云架构,提供灵活的补位选择,满足复杂应用需求。

相关推荐
ZHOU_WUYI12 分钟前
adb 安装教程
人工智能·adb
weixin_4430426531 分钟前
信息系统管理师试题-转型升级
人工智能·信息系统项目管理师
扶尔魔ocy1 小时前
【QT开发自制小工具】PDF/图片转excel---调用百度OCR API接口
qt·pdf·ocr·excel
CV-King1 小时前
旋转框目标检测自定义数据集训练测试流程
人工智能·目标检测·计算机视觉
努力的布布1 小时前
Elasticsearch-索引的批量操作
大数据·elasticsearch·搜索引擎·全文检索
无问社区1 小时前
无问社区-无问AI模型
人工智能·web安全·网络安全
RodrickOMG2 小时前
【大数据】Hadoop三节点集群搭建
大数据·hadoop·分布式
智慧化智能化数字化方案2 小时前
工业金融政务数据分类分级体系建设解读
大数据·金融·数据分类分级·政务·政务数据分类·工业数据分类·金融数据分类分级
Jacen.L2 小时前
探究音频丢字位置和丢字时间对pesq分数的影响
人工智能·语音识别
DashVector2 小时前
如何通过HTTP API插入或更新Doc
大数据·数据库·数据仓库·人工智能·http·数据库架构·向量检索