技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
weixin_40809967
1 天前
OCR 识别率提升实战:模糊 / 倾斜 / 反光图片全套优化方案(附 Python / Java / PHP 代码)
图像处理
·
人工智能
·
后端
·
python
·
ocr
·
api
·
抠图
weixin_40809967
1 天前
【实战教程】懒人精灵如何实现 OCR 文字识别?接口调用完整指南(附可运行示例)
java
·
前端
·
人工智能
·
后端
·
ocr
·
api
·
懒人精灵
蓦然乍醒
2 天前
零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战
人工智能
·
ocr
P-surp
2 天前
tesseract ocr 文字识别
ocr
AI人工智能+
2 天前
药品经营许可证识别技术:通过图像预处理、目标检测、序列识别和版面分析,实现对药品经营许可证关键信息的高精度提取
深度学习
·
计算机视觉
·
ocr
·
药品经营许可证识别
weixin_40809967
2 天前
【保姆级教程】易语言调用 OCR 文字识别 API(从0到1完整实战 + 示例源码)
图像处理
·
人工智能
·
后端
·
ocr
·
api
·
文字识别
·
易语言
weixin_40809967
2 天前
【保姆级教程】按键精灵调用 OCR 文字识别 API(从0到1完整实战 + 可运行脚本)
java
·
前端
·
人工智能
·
后端
·
ocr
·
api
·
按键精灵
小女孩真可爱
2 天前
paddleocr使用50显卡训练报错
人工智能
·
ocr
AI人工智能+
2 天前
基于高精度身份证OCR识别、炫彩活体检测及人脸比对技术的人脸核身系统,为通信行业数字化转型提供了坚实的安全底座
人工智能
·
计算机视觉
·
人脸识别
·
ocr
·
人脸核身
AI人工智能+
2 天前
一种以深度学习与计算机视觉技术为核心的表格识别系统,实现了结构化、半结构化表格的精准文字提取、布局解析与版面完整还原
深度学习
·
计算机视觉
·
ocr
·
表格识别
热门推荐
01
GitHub 镜像站点
02
一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛
03
基于 Docker 部署 Hermes Agent 并接入飞书机器人的完整指南
04
OpenClaw 请求超时 llm request timed out 怎么解决?3 种方案实测,附完整排查流程
05
VMware Workstation Pro 17 虚拟机完整安装教程(2026最新)
06
CodeBuddy与WorkBuddy深度对比:腾讯两款AI工具差异及实操指南
07
UV安装并设置国内源
08
Oh My Codex 快速使用指南
09
开发者环境配置:用 Ollama 实现本地大模型部署(附下载慢的解决方案
10
AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析