OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错

调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;

合合通用多语言:

https://www.textin.com/experience/text_recognize_3d1

百度的通用模型:

https://ai.baidu.com/tech/ocr/general?p=功能演示\&from=experience

版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

相关推荐
Virgil1391 天前
【TrOCR】训练代码
人工智能·深度学习·ocr
weixin_307779133 天前
批量OCR的GitHub项目
python·github·ocr
AI人工智能+3 天前
应用俄文OCR技术,为跨语言交流与数字化管理提供更强大的支持
人工智能·ocr·文字识别
云天徽上3 天前
【PaddleOCR】OCR表格识别数据集介绍,包含PubTabNet、好未来表格识别、WTW中文场景表格等数据,持续更新中......
python·ocr·文字识别·表格识别·paddleocr·pp-ocrv5
Edward-tan6 天前
基于 opencv+yolov8+easyocr的车牌追踪识别
python·opencv·ocr·yolov8
晓13136 天前
OpenCV篇——项目(二)OCR文档扫描
人工智能·python·opencv·pycharm·ocr
秋窗77 天前
Mac 部署Latex OCR并优化体验(打包成App并支持全局快捷键)
macos·ocr·latex
RainSerein7 天前
Laravel8中调取腾讯云文字识别OCR
ocr·php·腾讯云·laravel
老胖闲聊16 天前
Python pytesseract【OCR引擎库】 简介
开发语言·python·ocr
沉到海底去吧Go17 天前
【工具教程】PDF指定区域OCR识别重命名工具使用教程和注意事项
pdf·ocr·图片区域识别改名·仓储物流单据识别·物流单据识别改名·pdf区域识别改名·pdf区域识别重命名