动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
jiajia_lisa1 天前
轻量化智能升级,降本增效赋能长效运营
ocr
Komorebi_99991 天前
OCR + 大模型融合方案
大模型·ocr
AwakeFantasy2 天前
聊聊近况和最近做的踩坑项目
人工智能·python·gpt·ocr
EntyIU4 天前
mineru从安装部署到测试使用完整指南
python·ocr
OCR_133716212754 天前
技术解读:国内第一梯队 OCR 大模型现状与技术路线分析
ocr
AI人工智能+4 天前
赋能智慧监管:基于深度学习的特种行业许可证全要素精准识别系统
计算机视觉·自然语言处理·ocr·特种行业许可证识别
AI人工智能+4 天前
施工许可证智能识别系统通过融合计算机视觉与自然语言处理技术,实现了建筑行业关键证件的自动化信息提取
人工智能·深度学习·计算机视觉·ocr·施工许可证识别
王莎莎-MinerU5 天前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
庖丁AI5 天前
PDF表格提取工具怎么选?普通转换、OCR和解析工具的区别
pdf·ocr
weixin_397574095 天前
食品包装AI质检系统技术实现:从OCR提取到合规检测全链路
人工智能·ocr