OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错

调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;

合合通用多语言:

https://www.textin.com/experience/text_recognize_3d1

百度的通用模型:

https://ai.baidu.com/tech/ocr/general?p=功能演示\&from=experience

版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

相关推荐
AI人工智能+7 小时前
从“海量文书”到“精准数据”:文档智能抽取重塑车险核心竞争力
nlp·ocr·文档抽取
Stara05118 小时前
DeepSeek-OCR私有化部署—从零构建OCR服务环境
计算机视觉·docker·ocr·transformers·vllm·deepseek·光学符号识别
翔云 OCR API19 小时前
人工智能驱动下的OCR API技术演进与实践应用
人工智能·ocr
探模之翼21 小时前
深度解读 DeepSeek-OCR 论文:通过视觉模态实现高效文本压缩
大模型·ocr·deepseek-ocr
paopao_wu1 天前
DeepSeek-OCR实战(06):SpringBoot应用接入
java·spring boot·ai·ocr·deepseek
paopao_wu1 天前
DeepSeek-OCR实战(05):DeepSeek-OCR-WebUI部署(Docker)
docker·ai·容器·ocr
OpenBayes1 天前
教程上新丨Deepseek-OCR 以极少视觉 token 数在端到端模型中实现 SOTA
人工智能·深度学习·机器学习·ocr·大语言模型·文本处理·deepseek
kevin 11 天前
财报OCR录入识别软件准确率高吗?易道博识财报录入实测效果如何?
ocr
❀͜͡傀儡师1 天前
Docker 部署 DeepSeek-OCR 和WebUI
docker·容器·ocr
mit6.8241 天前
[Column#187] 10data_struct | IP速查表 | 协议&TCP&UDP | DeepSeek-OCR
tcp/ip·udp·ocr