OCR多语言识别模型构建资料收集

蓝色橘猫2023-09-02 23:09

OCR多语言识别模型构建

构建多语言识别模型方案

合合，百度，腾讯，阿里这四家的不错

调研多家，发现有两种方案，但是大多数厂商都是将多语言放在一个字典里，构建1w~2W的字典，训练一个可识别多种语言的模型；

合合通用多语言：

https://www.textin.com/experience/text_recognize_3d1

百度的通用模型：

https://ai.baidu.com/tech/ocr/general?p=功能演示\&from=experience

版式相关

https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout

上一篇：【MyBatisⅡ】动态 SQL

下一篇：计算机图形软件（三）6-6 小结

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 10.Net 优秀框架 ABP全面详解