动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
墨染天姬4 小时前
【AI】OCR开源模型排行
人工智能·开源·ocr
AI人工智能+5 小时前
智能表格识别技术融合深度学习与计算机视觉,突破传统表格数字化瓶颈
深度学习·ocr·表格识别
AI人工智能+1 天前
银行回单识别技术:基于深度学习,实现多格式回单秒级解析,识别精度超99.5%
深度学习·ocr·银行回单识别
AI人工智能+2 天前
基于深度学习的表格识别技术,通过多模态神经网络实现高精度OCR识别,支持复杂表格结构解析和版面还原
深度学习·ocr·表格识别
星辰引路-Lefan2 天前
[特殊字符] 开源一款基于 PaddleOCR 的纯离线 OCR 识别插件 | 支持身份证、银行卡、驾驶证识别
前端·开源·ocr
番石榴AI2 天前
JiaJiaOCR:面向Java ocr的开源库
java·图像处理·人工智能·计算机视觉·开源·ocr
源之缘-OFD先行者3 天前
C# 实现 OCR 转双层 OFD,字符坐标与原图 1:1 精准匹配
ocr
liulanba3 天前
OCR技术全流程详解:从原理到实现
ocr
anda01094 天前
DeepSeek-OCR:用“一张图“压缩万字长文,大模型记忆的新思路
ocr
漏刻有时4 天前
微信小程序学习实录12:wx.serviceMarket.invokeService接口OCR识别营业执照和银行卡
学习·微信小程序·ocr