技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
五点钟科技
4 小时前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能
·
llm
·
ocr
·
论文
·
大语言模型
·
deepseek
·
deepseek-ocr
爱吃饼干的熊猫
1 天前
告别“机械扫描”:DeepSeek-OCR-2用“视觉因果流”让AI像人一样读懂文档
ocr
Luke Ewin
1 天前
部署DeepSeek-OCR-2
ocr
·
deepseek
·
deepseek-ocr-2
confiself
1 天前
DeepSeek-OCR 2: Visual Causal Flow学习
学习
·
ocr
AI周红伟
1 天前
周红伟 DeepSeek-OCR v2技术原理和架构,部署案例实操
ocr
Coovally AI模型快速验证
2 天前
10亿参数刷新OCR记录:LightOnOCR-2如何以小博大?
人工智能
·
学习
·
yolo
·
3d
·
ocr
·
人机交互
zstar-_
2 天前
DeepSeek-OCR-2:视觉编码器的小优化
ocr
mseaspring
2 天前
DeepSeek-OCR 2:视觉因果流的突破
ocr
virtaitech
2 天前
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型
人工智能
·
科技
·
ai
·
ocr
·
gpu
·
算力
安如衫
2 天前
从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解
人工智能
·
ocr
·
agent
·
cv
·
rag
·
vlm
热门推荐
01
GitHub 镜像站点
02
Clawdbot 中文汉化版 接入微信、飞书
03
2026美赛A题智能手机电池续航时间预测的连续时间数学模型
04
OpenCode 入门教程:介绍 · 安装 · 配置第三方 API (如 Claude)
05
2025 年大语言模型发展回顾:关键突破、意外转折与 2026 年展望
06
OpenClaw部署与配置教程:在Mac mini上接入国产大模型与飞书
07
Linux下V2Ray安装配置指南
08
【Milvus】向量数据库pymilvus使用教程
09
2026数学建模美赛题目特点与选题建议,常用四大模型汇总
10
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services