技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
1nv1s1ble
6 天前
paddle ocr
ocr
·
paddle
Sinokap
7 天前
Let’s Encrypt 宣布推出短期证书与 IP 地址支持,推动 Web 安全迈向新高度
前端
·
tcp/ip
·
安全
·
ocr
赛卡
8 天前
Gerbv 与 Python 协同:实现 Gerber 文件智能分析与制造数据自动化
图像处理
·
人工智能
·
python
·
算法
·
计算机视觉
·
自动化
·
ocr
余子桃
8 天前
Python实现图片文字识别-OCR
ocr
猫头虎
8 天前
合合信息TextIn大模型加速器 2.0来了:智能文档解析和图表解析能力全面升级
开发语言
·
人工智能
·
python
·
计算机视觉
·
信息可视化
·
aigc
·
ocr
code_talking
9 天前
【OCR】技术
ocr
冲上云霄的Jayden
9 天前
PaddleNLP UIE 通过OCR识别银行回执信息
nlp
·
ocr
·
paddle
·
paddlenlp
·
信息提取
·
uie
·
银行回执
shuxunAPI
10 天前
驾驶证 OCR 识别 API 接口如何对接?
ocr
·
api
old_power
10 天前
OCR 识别案例
人工智能
·
计算机视觉
·
ocr
watersink
10 天前
5款视觉OCR开源模型
ocr
热门推荐
01
汽车上的各种质量:整备质量、总质量、装载质量、簧上质量、簧下质量
02
我决定放弃搞 Java 了
03
如何在WPS和Word/Excel中直接使用DeepSeek功能
04
基于Matlab的疲劳检测系统设计与实现
05
DeepSeek各版本说明与优缺点分析
06
从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑
07
生活电子常识--删除谷歌浏览器搜索记录
08
RAG 实践- Ollama+RagFlow 部署本地知识库
09
DeepSeek RAGFlow构建本地知识库系统
10
智能驾驶中预测模块简介