技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
EkihzniY
10 小时前
OCR 识别技术:各行业信息化转型的 “加速器”
ocr
虚行
15 小时前
一个海康相机OCR的程序
ocr
kevin 1
1 天前
智能文档处理业务,应该选择大模型还是OCR专用小模型?
ocr
空影星
1 天前
Pot Translator,跨平台划词翻译与OCR工具
python
·
ocr
·
电脑
私人珍藏库
2 天前
[Windows] 天若OCR开源版 6.0.0
ocr
ONLYOFFICE
2 天前
如何在ONLYOFFICE中使用OCR工具:轻松识别图片和PDF中的文字
编辑器
·
ocr
·
office
晨欣
2 天前
Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!
linux
·
运维
·
ocr
doris610
4 天前
资产 OCR 识别:批量导入效率提升指南
ocr
·
资产管理
·
固定资产管理系统
TextIn智能文档云平台
4 天前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf
·
ocr
EkihzniY
5 天前
OCR 证件识别:驱动澳门酒店自助入住智能化
嵌入式硬件
·
ocr
热门推荐
01
KGG转MP3工具|非KGM文件|解密音频
02
GitHub 镜像站点
03
conda中设置镜像地址(附所有可换的地址)
04
UV安装并设置国内源
05
A股预测还能更准?开源大模型Kronos带你跑通预测+回测全流程
06
46个Nano-banana 精选提示词,持续更新中
07
UV 工具安装与国内镜像源配置指南
08
突破百度网盘的下载限速,两种方法教会你【超详细】
09
Spec-Kit 使用指南
10
教你如何认证 Gemini 教育优惠的二次验证,薅个 1年的 Gemini Pro 会员