常见开源ocr评测

使用过多款ocr软件,具体的测试数据不在这里展示,根据我的使用经验为大家避坑。

tesseract(严重不推荐)

传统ocr软件,据说后来使用了ai推理,16年左右的时候效果非常差,堪称垃圾。

DeepSeek-OCR(效果不行)

deepseek名气大,但ocr精度差,使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线,属于串联式ocr,其中和ocr相关的主要是ocr v5和vl,vl集成了版面识别,图片识别,表格识别,公式识别,图表识别等等,功能复杂,参数众多,精度还可以,但是速度不行,并且里面还有bug不成熟。文档丰富,但是感觉比较凌乱。v5不如vl。

olmocr(精度好,速度快,特别是段落识别好)

精度和速度都令人满意,特别是段落识别好,我只在它demo网站上测试过没有实际部署。

HunyuanOCR(精度好,速度快,值得推荐)

精度最高,速度快,部署简单,刚开源的文档严重不足,需要22G左右显存,刚好可以部署在rtx 4090上。

以商业收费,成熟的google ocr为标准,在我们的内部评测中精度得分92,ppocr vl得分90,混元ocr得分98,olmocr没有实际验证,应该是比较接近混元ocr。

相关推荐
修己xj8 小时前
复制即所得:PasteMD让Markdown粘贴Office不再有格式烦恼
开源
GitCode官方10 小时前
GLM-Image 上线 AtomGit,国产芯片训练的多模态开源模型开放使用
开源
文慧的科技江湖14 小时前
重卡的充电桩一般都是多少千瓦? - 慧知开源充电桩平台
java·开发语言·开源·充电桩开源平台·慧知重卡开源充电桩平台
OctShop大型商城源码15 小时前
免费开源大型多商家多用户商城系统_可商用_无需授权_OctShop
开源·商城系统·积分系统·多用户商城·多商家商城系统
OpenTiny社区16 小时前
TinyPro v1.4.0 正式发布:支持 Spring Boot、移动端适配、新增卡片列表和高级表单页面
java·前端·spring boot·后端·开源·opentiny
小希smallxi17 小时前
FFmpeg: 免费、开源、跨平台的多媒体处理工具集
ffmpeg·开源
何以解忧唯有撸码18 小时前
c#实现包裹扣面单的几种方式
ocr·opencvsharp·扣面单
2501_9061505618 小时前
开源问卷系统DWSurvey部署方式记录-原生包部署
开源
ai产品老杨19 小时前
集绿色智能方法与智能系统等前沿技术于一体的智慧能源完成开源
支持向量机·开源·能源·散列表·启发式算法·模拟退火算法
大犀牛牛19 小时前
开放签电子签章系统3.3.1版本更新内容
开源·数字签名·电子合同·电子签章