技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
2401_83623586
3 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能
·
科技
·
深度学习
·
ocr
·
生活
2401_83623586
13 小时前
财务报表识别产品:从“数据搬运”到“智能决策”的技术革命
人工智能
·
科技
·
深度学习
·
ocr
·
生活
A小码哥
1 天前
DeepSeek-OCR-2 开源 OCR 模型的技术
ocr
2401_83623586
2 天前
中安未来行驶证识别:以OCR智能力量,重构车辆证件数字化效率
人工智能
·
深度学习
·
ocr
HyperAI超神经
2 天前
在线教程|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁
开发语言
·
人工智能
·
深度学习
·
神经网络
·
机器学习
·
ocr
·
创业创新
蛋王派
2 天前
DeepSeek-OCR-v2 模型解析和部署应用
人工智能
·
ocr
小白狮ww
3 天前
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描
人工智能
·
深度学习
·
机器学习
·
ocr
·
cpu
·
gpu
·
deepseek
智慧地球(AI·Earth)
3 天前
DeepSeek架构新探索!开源OCR 2诞生!
架构
·
ocr
OpenBayes
3 天前
教程上新|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁
人工智能
·
深度学习
·
目标检测
·
机器学习
·
大模型
·
ocr
·
gpu算力
PPIO派欧云
3 天前
PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署
人工智能
·
ai
·
大模型
·
ocr
·
智谱
热门推荐
01
GitHub 镜像站点
02
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
03
openclaw配置教程(linux+局域网ollama)
04
UV安装并设置国内源
05
Linux下V2Ray安装配置指南
06
AI 规范驱动开发“三剑客”深度对比:Spec-Kit、Kiro 与 OpenSpec 实战指南
07
openclaw使用nginx反代部署过程 与disconnected (1008): pairing required解决
08
在Trae中使用Pencil MCP
09
Claude Code Skills 实用使用手册
10
Vue-skills的中文文档