常见开源ocr评测

使用过多款ocr软件,具体的测试数据不在这里展示,根据我的使用经验为大家避坑。

tesseract(严重不推荐)

传统ocr软件,据说后来使用了ai推理,16年左右的时候效果非常差,堪称垃圾。

DeepSeek-OCR(效果不行)

deepseek名气大,但ocr精度差,使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线,属于串联式ocr,其中和ocr相关的主要是ocr v5和vl,vl集成了版面识别,图片识别,表格识别,公式识别,图表识别等等,功能复杂,参数众多,精度还可以,但是速度不行,并且里面还有bug不成熟。文档丰富,但是感觉比较凌乱。v5不如vl。

olmocr(精度好,速度快,特别是段落识别好)

精度和速度都令人满意,特别是段落识别好,我只在它demo网站上测试过没有实际部署。

HunyuanOCR(精度好,速度快,值得推荐)

精度最高,速度快,部署简单,刚开源的文档严重不足,需要22G左右显存,刚好可以部署在rtx 4090上。

以商业收费,成熟的google ocr为标准,在我们的内部评测中精度得分92,ppocr vl得分90,混元ocr得分98,olmocr没有实际验证,应该是比较接近混元ocr。

相关推荐
迪菲赫尔曼16 小时前
从 0 到 1 打造工业级推理控制台:UltraConsole(Ultralytics + FastAPI + React)开源啦!
前端·yolo·react.js·计算机视觉·开源·fastapi
泉飒16 小时前
某特定场景下的ocr增强方式
ocr
中微子17 小时前
突然爆火的Warp 终端,开源1天破 4w Stars
linux·人工智能·开源
kobesdu18 小时前
连接大模型与物理机器人-RoboNeuron让机器人真正“听懂人话”
机器人·开源·ros·人形机器人
sitellla18 小时前
MySQL 入门:最流行的开源关系型数据库介绍
数据库·mysql·其他·开源
GEO索引未来20 小时前
国内首部GEO可信传播标准立项通过/DeepSeek-V4 正式上线并开源/Open AI、Google继续推进AI广告标准化
大数据·人工智能·gpt·ai·chatgpt·开源
炸裂狸花猫20 小时前
开源身份认证与访问管理平台 - Keycloak(二)
docker·云原生·容器·kubernetes·开源·keycloak·sso
小陈phd20 小时前
多模态大模型学习笔记(三十八)——传统OCR技术机制:从DBNet到CRNN:吃透传统OCR两阶段范式的底层逻辑
笔记·学习·ocr
炸裂狸花猫20 小时前
开源身份认证与访问管理平台 - Keycloak(一)
docker·云原生·kubernetes·开源·devops
rustfs20 小时前
MinIO 国产平替,RustFS 发布 Beta 版本啦
分布式·docker·云原生·rust·开源