OCR多语言识别模型构建资料收集

OCR多语言识别模型构建

构建多语言识别模型方案

合合,百度,腾讯,阿里这四家的不错

调研多家,发现有两种方案,但是大多数厂商都是将多语言放在一个字典里,构建1w~2W的字典,训练一个可识别多种语言的模型;

合合通用多语言:

https://www.textin.com/experience/text_recognize_3d1

百度的通用模型:

https://ai.baidu.com/tech/ocr/general?p=功能演示\&from=experience

版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

相关推荐
Blessed_Li2 小时前
DeepSeek-OCR深度解析:新一代开源OCR模型的技术突破与核心优势
ocr·deepseek
wanzhong23336 小时前
Deepseek-ocr论文精读
深度学习·ocr·多模态·deepseek
测试19986 小时前
Selenium自动化测试+OCR-获取图片页面小说详解
自动化测试·软件测试·python·selenium·测试工具·ocr·测试用例
EkihzniY7 小时前
OCR 识别:电子保单的数字化助力
ocr
刘欣的博客8 小时前
C# 上传票据文件 调用Dify的API完成OCR识别
c#·ocr·api·dify
许泽宇的技术分享1 天前
DeepSeek-OCR:视觉压缩的革命性突破——当OCR遇上LLM的“降维打击“
ocr
zstar-_1 天前
DeepSeek-OCR可能成为开启新时代的钥匙
人工智能·ocr
猫头虎1 天前
DeepSeek刚刚开源了一个3B的 OCR模型:什么是DeepSeek-OCR?单张A100-40G每天可以处理20万+页文档
人工智能·开源·whisper·prompt·aigc·ocr·gpu算力
youcans_1 天前
【DeepSeek论文精读】13. DeepSeek-OCR:上下文光学压缩
论文阅读·人工智能·计算机视觉·ocr·deepseek
侃侃_天下2 天前
关于 DeepSeek-OCR 的猜想
ocr·deepseek-ocr