常见开源ocr评测

使用过多款ocr软件,具体的测试数据不在这里展示,根据我的使用经验为大家避坑。

tesseract(严重不推荐)

传统ocr软件,据说后来使用了ai推理,16年左右的时候效果非常差,堪称垃圾。

DeepSeek-OCR(效果不行)

deepseek名气大,但ocr精度差,使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线,属于串联式ocr,其中和ocr相关的主要是ocr v5和vl,vl集成了版面识别,图片识别,表格识别,公式识别,图表识别等等,功能复杂,参数众多,精度还可以,但是速度不行,并且里面还有bug不成熟。文档丰富,但是感觉比较凌乱。v5不如vl。

olmocr(精度好,速度快,特别是段落识别好)

精度和速度都令人满意,特别是段落识别好,我只在它demo网站上测试过没有实际部署。

HunyuanOCR(精度好,速度快,值得推荐)

精度最高,速度快,部署简单,刚开源的文档严重不足,需要22G左右显存,刚好可以部署在rtx 4090上。

以商业收费,成熟的google ocr为标准,在我们的内部评测中精度得分92,ppocr vl得分90,混元ocr得分98,olmocr没有实际验证,应该是比较接近混元ocr。

相关推荐
JustHappy9 分钟前
「web extensions🛠️」有关浏览器扩展,开发前你需要知道一些......
前端·javascript·开源
2401_836235862 小时前
中安未来行驶证识别:以OCR智能力量,重构车辆证件数字化效率
人工智能·深度学习·ocr
一只大侠的侠2 小时前
Flutter开源鸿蒙跨平台训练营 Day8获取轮播图网络数据并实现展示
flutter·开源·harmonyos
DolitD3 小时前
云流技术深度剖析:国内云渲染主流技术与开源和海外厂商技术实测对比
功能测试·云原生·开源·云计算·实时云渲染
一战成名9963 小时前
深度解析 CANN 模型转换工具链:从 ONNX 到 OM
人工智能·学习·安全·开源
聆风吟º9 小时前
CANN开源项目深度实践:基于amct-toolkit实现自动化模型量化与精度保障策略
运维·开源·自动化·cann
冬奇Lab10 小时前
一天一个开源项目(第15篇):MapToPoster - 用代码将城市地图转换为精美的海报设计
python·开源
大大大反派13 小时前
CANN 生态未来展望:统一框架 `CANN Unified` 与开源协同演进
开源
酷酷的崽79813 小时前
CANN 开源生态实战:端到端构建高效文本分类服务
分类·数据挖掘·开源
晚霞的不甘13 小时前
CANN 在工业质检中的亚像素级视觉检测系统设计
人工智能·计算机视觉·架构·开源·视觉检测