技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
AI人工智能+
14 小时前
发票识别技术:结合OCR与AI技术,实现纸质票据高效数字化,推动企业智能化转型
人工智能
·
nlp
·
ocr
·
发票识别
AI人工智能+
17 小时前
结婚证识别技术:利用OCR和深度学习实现婚姻证件信息的自动提取与结构化处理
深度学习
·
ocr
·
结婚证识别
xyj4189
21 小时前
《深入理解Java虚拟机JVM高级特性与最佳实践》
ocr
东风西巷
2 天前
STranslate(翻译工具OCR工具) 中文绿色版
学习
·
ocr
·
电脑
·
软件需求
XXX-X-XXJ
2 天前
三、从 MinIO 存储到 OCR 提取,再到向量索引生成
人工智能
·
后端
·
python
·
ocr
EkihzniY
2 天前
车牌 OCR 识别:国庆高速免费通行的 “隐形引擎”
ocr
wt_cs
2 天前
OCR API让工作归于调理-文字识别接口-发票、银行卡、文档识别
ocr
qq_54693727
2 天前
身份证批量ocr
ocr
AI人工智能+
2 天前
行驶证识别技术通过OCR和AI实现信息自动化采集与处理,涵盖图像预处理、文字识别及结构化校验,提升效率与准确性
人工智能
·
深度学习
·
ocr
·
行驶证识别
EkihzniY
2 天前
医疗发票 OCR 识别:打通医疗费用处理 “堵点” 的技术助手
大数据
·
人工智能
·
ocr
热门推荐
01
两千字总结:Codex 国内如何安装和使用的教程,以及如何设置中文回答
02
BongoCat - 跨平台键盘猫动画工具
03
GitHub 镜像站点
04
UV安装并设置国内源
05
Linux下V2Ray安装配置指南
06
GitLab 零基础入门指南:从安装到项目管理全流程
07
智能库存管理的需求预测模型:从业务痛点到落地代码的完整实践
08
46个Nano-banana 精选提示词,持续更新中
09
2025羊城杯网络安全大赛 wp
10
UV 工具安装与国内镜像源配置指南