技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
易连EDI—EasyLink
2 天前
易连EDI–EasyLink实现OCR智能数据采集
网络
·
人工智能
·
安全
·
汽车
·
ocr
·
edi
泉飒
3 天前
某特定场景下的ocr增强方式
ocr
小陈phd
3 天前
多模态大模型学习笔记(三十八)——传统OCR技术机制:从DBNet到CRNN:吃透传统OCR两阶段范式的底层逻辑
笔记
·
学习
·
ocr
石榴树下的七彩鱼
3 天前
OCR API价格对比2026:身份证/发票/医疗票据识别哪家性价比最高?含Python对接+成本公式
开发语言
·
人工智能
·
python
·
ocr
·
图像识别
·
文字识别
·
api接口
sali-tec
3 天前
C# 基于OpenCv的视觉工作流-章56-OCR
图像处理
·
人工智能
·
opencv
·
算法
·
计算机视觉
·
ocr
AI人工智能+
4 天前
从像素到数据:浅析计算机视觉与自然语言处理驱动的毕业证书识别
深度学习
·
计算机视觉
·
自然语言处理
·
ocr
·
毕业证书识别
AI人工智能+
4 天前
基于深度学习的银行回单识别技术,成为连接物理票据与数字财务系统的桥梁
深度学习
·
计算机视觉
·
ocr
·
银行回单识别
qq_45239623
5 天前
第十篇:《自动化处理验证码:OCR、接口绕过与第三方服务》
android
·
自动化
·
ocr
LcGero
5 天前
移动端AI OCR模型选型
人工智能
·
ai
·
ocr
LcGero
5 天前
腾讯混元OCR:1B小模型如何在OCR界扛起SOTA大旗
ai
·
ocr
·
腾讯
·
sota
·
混元
·
1b
热门推荐
01
要裂开了!ChatGPT要手机号验证了?注册Codex要求验证电话号码怎么办?2026年登陆Codex要手机号验证的解决办法
02
GitHub 镜像站点
03
【AI】2026 年具身智能模型和世界模型总结
04
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
05
Codex 接入 DeepSeek API 完整配置文档
06
2026年AI前瞻:量子AI、具身智能与科学发现的新纪元
07
零基础教你claude code 接入 deepseek V4
08
在Windows 11上安装Docker的踩坑记录
09
实测可用|小米 MiMo 百万亿 Token 免费领,开发者速冲
10
2026年4月AI大事件深度解读:大模型竞争进入“深水区“