动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
AI人工智能+11 小时前
一种融合AI与OCR的施工许可证识别技术,提升工程监管效率,实现自动化、精准化处理。
人工智能·自动化·ocr·施工许可证识别
抠头专注python环境配置1 天前
OCR库pytesseract安装保姆级教程
python·ocr·conda
熊猫钓鱼>_>3 天前
深入解析 Monkey OCR:本地化、多语言文本识别的利器与实践指南
ocr
代码AI弗森4 天前
PDF OCR + 大模型:让文档理解不止停留在识字
pdf·ocr
AI人工智能+6 天前
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
人工智能·ocr·银行卡识别
deephub7 天前
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
人工智能·深度学习·神经网络·ocr
ccut 第一混8 天前
c#联合Halcon进行OCR字符识别(含halcon-25.05 百度网盘)
c#·ocr·halcon
R-G-B10 天前
【04】OpenCV C++实战篇——实战:发票精准定位,提取指定单元格数据。(倾角计算、旋转矫正、产品定位、目标定位、OCR文字提取)
c++·opencv·ocr·发票精准定位·提取指定单元格数据·倾角计算·旋转矫正
EkihzniY11 天前
单层 PDF 与双层 PDF:一字之差,功能大不同
pdf·ocr
郭庆汝14 天前
本地服务器端部署基于大模型的通用OCR项目——dots.ocr
ocr