动手RAG: ocr调研

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)


表格识别

部署

pdf解析

文档解析

参考

相关推荐
五点钟科技4 小时前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
爱吃饼干的熊猫1 天前
告别“机械扫描”:DeepSeek-OCR-2用“视觉因果流”让AI像人一样读懂文档
ocr
Luke Ewin1 天前
部署DeepSeek-OCR-2
ocr·deepseek·deepseek-ocr-2
confiself1 天前
DeepSeek-OCR 2: Visual Causal Flow学习
学习·ocr
AI周红伟1 天前
周红伟 DeepSeek-OCR v2技术原理和架构,部署案例实操
ocr
Coovally AI模型快速验证2 天前
10亿参数刷新OCR记录:LightOnOCR-2如何以小博大?
人工智能·学习·yolo·3d·ocr·人机交互
zstar-_2 天前
DeepSeek-OCR-2:视觉编码器的小优化
ocr
mseaspring2 天前
DeepSeek-OCR 2:视觉因果流的突破
ocr
virtaitech2 天前
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型
人工智能·科技·ai·ocr·gpu·算力
安如衫2 天前
从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解
人工智能·ocr·agent·cv·rag·vlm