常见开源ocr评测

使用过多款ocr软件,具体的测试数据不在这里展示,根据我的使用经验为大家避坑。

tesseract(严重不推荐)

传统ocr软件,据说后来使用了ai推理,16年左右的时候效果非常差,堪称垃圾。

DeepSeek-OCR(效果不行)

deepseek名气大,但ocr精度差,使用了一天就抛弃了。

PaddleOCR(效果还可以)

这个ocr有很多产线,属于串联式ocr,其中和ocr相关的主要是ocr v5和vl,vl集成了版面识别,图片识别,表格识别,公式识别,图表识别等等,功能复杂,参数众多,精度还可以,但是速度不行,并且里面还有bug不成熟。文档丰富,但是感觉比较凌乱。v5不如vl。

olmocr(精度好,速度快,特别是段落识别好)

精度和速度都令人满意,特别是段落识别好,我只在它demo网站上测试过没有实际部署。

HunyuanOCR(精度好,速度快,值得推荐)

精度最高,速度快,部署简单,刚开源的文档严重不足,需要22G左右显存,刚好可以部署在rtx 4090上。

以商业收费,成熟的google ocr为标准,在我们的内部评测中精度得分92,ppocr vl得分90,混元ocr得分98,olmocr没有实际验证,应该是比较接近混元ocr。

相关推荐
她的男孩1 天前
后台接口加密别只会 HTTPS,ForgeAdmin 的 RSA + SM4/AES 源码拆解
后端·面试·开源
fthux1 天前
如果你用 Mac,那你可能需要 Noti Shift
macos·开源·github
冬奇Lab2 天前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能·开源·资讯
小爷毛毛_卓寿杰2 天前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
饼干哥哥2 天前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范
HelloGitHub2 天前
《HelloGitHub》第 123 期
开源·github
修己xj2 天前
基于 Datasheet 二次开发:一个纯浏览器端的 PostgreSQL 数据分析工具
开源
冬奇Lab3 天前
每日一个开源项目(第144篇):ai-website-cloner-template - 一条命令、多 Agent 并行,把任意网站逆向成 Next.js 代码
前端·人工智能·开源
冬奇Lab5 天前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯