技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
星空的资源小屋
1 小时前
Text Grab,一款OCR 截图文字识别工具
python
·
django
·
ocr
·
scikit-learn
武子康
14 小时前
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
人工智能
·
深度学习
·
机器学习
·
ai
·
ocr
·
deepseek
·
deepseek-ocr
亚林瓜子
15 小时前
在amazon linux 2023上面通过Fedora 36软件仓库源安装tesseract5
linux
·
运维
·
服务器
·
ocr
·
tesseract
·
amazon
·
fedor
PythonFun
1 天前
OCR图片识别翻译工具功能及源码
python
·
ocr
·
机器翻译
用什么都重名
1 天前
DeepSeek-OCR 深度解析
人工智能
·
ocr
·
deepseek-ocr
lvnacp
1 天前
Qwen3-VL微调自定义OCR任务
ocr
weixin_43798812
2 天前
信创模盒 ModelHub XC|高效适配最新国产全模态文字识别模型 DeepSeek-OCR
ocr
亚林瓜子
2 天前
SpringBoot中使用tess4j进行OCR(在macos上面开发)
java
·
spring boot
·
macos
·
ocr
·
lstm
·
tess4j
咕咚-萌西
2 天前
DeepSeek-OCR
人工智能
·
深度学习
·
ocr
仙人掌_lz
4 天前
Hybrid OCR-LLM框架用于在大量复杂密集企业级文档信息提取
人工智能
·
ocr
·
文档解析
热门推荐
01
GitHub 镜像站点
02
综合整理:pdf预览显示:你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源,请打开此文件以看其内容,如何解决以正常预览文件
03
UV安装并设置国内源
04
npm使用国内淘宝镜像的方法
05
Linux下V2Ray安装配置指南
06
BongoCat - 跨平台键盘猫动画工具
07
《大数据技术原理与应用》实验报告三 熟悉HBase常用操作
08
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
09
NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南
10
jdk21下载、安装(Windows、Linux、macOS)