动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
菜就多练_082813 小时前
《深度学习》OpenCV 摄像头OCR 过程及案例解析
人工智能·深度学习·opencv·ocr
OCR_wintone4211 天前
中安未来 OCR—— 开启高效驾驶证识别新时代
人工智能·汽车·ocr
OCR_wintone4211 天前
中安未来 OCR—— 开启文字识别新时代
人工智能·深度学习·ocr
OCR_wintone4211 天前
翔云 OCR:发票识别与验真
人工智能·深度学习·ocr
OCR_wintone4212 天前
中安未来 OCR:引领智能报关新时代
ocr
Maxx Space5 天前
828华为云征文|部署开源超轻量中文OCR项目 TrWebOCR
docker·开源·华为云·github·ocr
编程乐趣5 天前
tesseract:一个.Net版本的开源OCR项目
ocr·.net
吃什么芹菜卷6 天前
机器学习:opencv--摄像头OCR
人工智能·笔记·opencv·计算机视觉·ocr
翔云API6 天前
回执单识别-银行回单识别API-文字识别OCR API
ocr
Days20508 天前
开源23.6k star 一款即用型 OCR,支持 80+ 种语言和所有流行的书写脚本,只需几行代码即可实现文字识别功能。
ocr