技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
Edward-tan
2 天前
基于 opencv+yolov8+easyocr的车牌追踪识别
python
·
opencv
·
ocr
·
yolov8
晓1313
2 天前
OpenCV篇——项目(二)OCR文档扫描
人工智能
·
python
·
opencv
·
pycharm
·
ocr
秋窗7
3 天前
Mac 部署Latex OCR并优化体验(打包成App并支持全局快捷键)
macos
·
ocr
·
latex
RainSerein
3 天前
Laravel8中调取腾讯云文字识别OCR
ocr
·
php
·
腾讯云
·
laravel
老胖闲聊
12 天前
Python pytesseract【OCR引擎库】 简介
开发语言
·
python
·
ocr
沉到海底去吧Go
13 天前
【工具教程】PDF指定区域OCR识别重命名工具使用教程和注意事项
pdf
·
ocr
·
图片区域识别改名
·
仓储物流单据识别
·
物流单据识别改名
·
pdf区域识别改名
·
pdf区域识别重命名
heart000_1
14 天前
通义大模型在文档自动化处理中的高效部署指南(OCR集成与批量处理优化)
运维
·
自动化
·
ocr
kevin 1
14 天前
OCR大模型,破解金融文档处理困境,从文字识别到文字理解
金融
·
ocr
Just_Paranoid
14 天前
华为云Flexus+DeepSeek征文|基于Dify构建智能票据信息识别助手
华为云
·
ocr
·
dify
·
maas
·
deepseek
·
flexusx
whoarethenext
14 天前
使用 C++/OpenCV 构建中文 OCR 系统:实现账单、发票及 PDF 读取
c++
·
opencv
·
ocr
热门推荐
01
GPU 进阶笔记(二):华为昇腾 910B GPU
02
Coze实战第13讲:飞书多维表格读取+豆包生图模型,轻松批量生成短剧封面
03
Coze扣子平台完整体验和实践(附国内和国际版对比)
04
MIUI显示/隐藏5G开关的方法,信号弱时开启手机Wifi通话方法
05
手机电脑之间快速传输图片视频文件,不压缩画质、不限制大小的方法!
06
扣子(coze)实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解
07
扣子空间的使用教程与大模型技术思考
08
华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南
09
DeepSeek各版本说明与优缺点分析
10
Word粘贴时出现“运行时错误53,文件未找到:MathPage.WLL“的解决方案