动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
EkihzniY10 小时前
OCR 识别技术:各行业信息化转型的 “加速器”
ocr
虚行15 小时前
一个海康相机OCR的程序
ocr
kevin 11 天前
智能文档处理业务,应该选择大模型还是OCR专用小模型?
ocr
空影星1 天前
Pot Translator,跨平台划词翻译与OCR工具
python·ocr·电脑
私人珍藏库2 天前
[Windows] 天若OCR开源版 6.0.0
ocr
ONLYOFFICE2 天前
如何在ONLYOFFICE中使用OCR工具:轻松识别图片和PDF中的文字
编辑器·ocr·office
晨欣2 天前
Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!
linux·运维·ocr
doris6104 天前
资产 OCR 识别:批量导入效率提升指南
ocr·资产管理·固定资产管理系统
TextIn智能文档云平台4 天前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf·ocr
EkihzniY5 天前
OCR 证件识别:驱动澳门酒店自助入住智能化
嵌入式硬件·ocr