技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
墨染天姬
4 小时前
【AI】OCR开源模型排行
人工智能
·
开源
·
ocr
AI人工智能+
5 小时前
智能表格识别技术融合深度学习与计算机视觉,突破传统表格数字化瓶颈
深度学习
·
ocr
·
表格识别
AI人工智能+
1 天前
银行回单识别技术:基于深度学习,实现多格式回单秒级解析,识别精度超99.5%
深度学习
·
ocr
·
银行回单识别
AI人工智能+
2 天前
基于深度学习的表格识别技术,通过多模态神经网络实现高精度OCR识别,支持复杂表格结构解析和版面还原
深度学习
·
ocr
·
表格识别
星辰引路-Lefan
2 天前
[特殊字符] 开源一款基于 PaddleOCR 的纯离线 OCR 识别插件 | 支持身份证、银行卡、驾驶证识别
前端
·
开源
·
ocr
番石榴AI
2 天前
JiaJiaOCR:面向Java ocr的开源库
java
·
图像处理
·
人工智能
·
计算机视觉
·
开源
·
ocr
源之缘-OFD先行者
3 天前
C# 实现 OCR 转双层 OFD,字符坐标与原图 1:1 精准匹配
ocr
liulanba
3 天前
OCR技术全流程详解:从原理到实现
ocr
anda0109
4 天前
DeepSeek-OCR:用“一张图“压缩万字长文,大模型记忆的新思路
ocr
漏刻有时
4 天前
微信小程序学习实录12:wx.serviceMarket.invokeService接口OCR识别营业执照和银行卡
学习
·
微信小程序
·
ocr
热门推荐
01
GitHub 镜像站点
02
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
03
Labelme从安装到标注:零基础完整指南
04
【踩坑笔记】50系显卡适配的 PyTorch 安装
05
Linux下V2Ray安装配置指南
06
手把手教你通过Gemini3 pro 学生认证,白用一年,手慢无!
07
jdk21下载、安装(Windows、Linux、macOS)
08
GitLab 零基础入门指南:从安装到项目管理全流程
09
Opencode CLI 安装成功,但是启动失败
10
UV安装并设置国内源