常见开源ocr评测

robinspada2025-12-06 13:24

使用过多款ocr软件，具体的测试数据不在这里展示，根据我的使用经验为大家避坑。

tesseract（严重不推荐）

传统ocr软件，据说后来使用了ai推理，16年左右的时候效果非常差，堪称垃圾。

DeepSeek-OCR（效果不行）

deepseek名气大，但ocr精度差，使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线，属于串联式ocr，其中和ocr相关的主要是ocr v5和vl，vl集成了版面识别，图片识别，表格识别，公式识别，图表识别等等，功能复杂，参数众多，精度还可以，但是速度不行，并且里面还有bug不成熟。文档丰富，但是感觉比较凌乱。v5不如vl。

olmocr（精度好，速度快，特别是段落识别好）

精度和速度都令人满意，特别是段落识别好，我只在它demo网站上测试过没有实际部署。

HunyuanOCR（精度好，速度快，值得推荐）

精度最高，速度快，部署简单，刚开源的文档严重不足，需要22G左右显存，刚好可以部署在rtx 4090上。

以商业收费，成熟的google ocr为标准，在我们的内部评测中精度得分92，ppocr vl得分90，混元ocr得分98，olmocr没有实际验证，应该是比较接近混元ocr。