常见开源ocr评测

使用过多款ocr软件,具体的测试数据不在这里展示,根据我的使用经验为大家避坑。

tesseract(严重不推荐)

传统ocr软件,据说后来使用了ai推理,16年左右的时候效果非常差,堪称垃圾。

DeepSeek-OCR(效果不行)

deepseek名气大,但ocr精度差,使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线,属于串联式ocr,其中和ocr相关的主要是ocr v5和vl,vl集成了版面识别,图片识别,表格识别,公式识别,图表识别等等,功能复杂,参数众多,精度还可以,但是速度不行,并且里面还有bug不成熟。文档丰富,但是感觉比较凌乱。v5不如vl。

olmocr(精度好,速度快,特别是段落识别好)

精度和速度都令人满意,特别是段落识别好,我只在它demo网站上测试过没有实际部署。

HunyuanOCR(精度好,速度快,值得推荐)

精度最高,速度快,部署简单,刚开源的文档严重不足,需要22G左右显存,刚好可以部署在rtx 4090上。

以商业收费,成熟的google ocr为标准,在我们的内部评测中精度得分92,ppocr vl得分90,混元ocr得分98,olmocr没有实际验证,应该是比较接近混元ocr。

相关推荐
wAIxiSeu7 分钟前
开源项目分享——CLI-Anything
开源·github
进击monkey17 分钟前
2026 年 AI Wiki 推荐:PandaWiki——AI 原生+开源私有化,企业级知识库最优解
人工智能·开源·ai知识库
霪霖笙箫24 分钟前
真授之以渔:我是怎么从"想给文章配几张图",一步步做出一个可发布 skill 的
前端·人工智能·开源
亥时科技38 分钟前
2026 低空经济政策红利释放!开源 AI 无人机平台成产业落地新引擎
开源·无人机
ai_coder_ai1 小时前
如何使用ocr来实现自动化脚本?
ocr·autojs·自动化脚本·冰狐智能辅助·easyclick
研究点啥好呢2 小时前
3月19日GitHub热门项目推荐|OpenClaw棋逢对手
人工智能·ai·开源·github
科技圈快讯2 小时前
文多多AIPPT:部分开源+私有化部署重构PPT创作体验
重构·开源·powerpoint
猫头虎2 小时前
从零开始,一步步安装和配置OpenClaw汉化版详细安装指南
langchain·开源·prompt·github·aigc·ai编程·agi
虚幻如影2 小时前
Tesseract-OCR 引擎安装
python·ocr
冷小鱼2 小时前
Milvus 向量数据库完全指南:开源架构与生产级部署实战
数据库·开源·milvus