OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错

调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;

合合通用多语言:

https://www.textin.com/experience/text_recognize_3d1

百度的通用模型:

https://ai.baidu.com/tech/ocr/general?p=功能演示\&from=experience

版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

相关推荐
抠头专注python环境配置16 小时前
OCR库pytesseract安装保姆级教程
python·ocr·conda
熊猫钓鱼>_>3 天前
深入解析 Monkey OCR:本地化、多语言文本识别的利器与实践指南
ocr
代码AI弗森4 天前
PDF OCR + 大模型:让文档理解不止停留在识字
pdf·ocr
AI人工智能+6 天前
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
人工智能·ocr·银行卡识别
deephub6 天前
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
人工智能·深度学习·神经网络·ocr
ccut 第一混7 天前
c#联合Halcon进行OCR字符识别(含halcon-25.05 百度网盘)
c#·ocr·halcon
R-G-B10 天前
【04】OpenCV C++实战篇——实战:发票精准定位,提取指定单元格数据。(倾角计算、旋转矫正、产品定位、目标定位、OCR文字提取)
c++·opencv·ocr·发票精准定位·提取指定单元格数据·倾角计算·旋转矫正
EkihzniY10 天前
单层 PDF 与双层 PDF:一字之差,功能大不同
pdf·ocr
郭庆汝14 天前
本地服务器端部署基于大模型的通用OCR项目——dots.ocr
ocr
EkihzniY15 天前
OCR 精准识别验讫章:让登记与校验更智能
ocr