技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
AI人工智能+
11 小时前
一种融合AI与OCR的施工许可证识别技术,提升工程监管效率,实现自动化、精准化处理。
人工智能
·
自动化
·
ocr
·
施工许可证识别
抠头专注python环境配置
1 天前
OCR库pytesseract安装保姆级教程
python
·
ocr
·
conda
熊猫钓鱼>_>
3 天前
深入解析 Monkey OCR:本地化、多语言文本识别的利器与实践指南
ocr
代码AI弗森
4 天前
PDF OCR + 大模型:让文档理解不止停留在识字
pdf
·
ocr
AI人工智能+
6 天前
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
人工智能
·
ocr
·
银行卡识别
deephub
7 天前
Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22
人工智能
·
深度学习
·
神经网络
·
ocr
ccut 第一混
8 天前
c#联合Halcon进行OCR字符识别(含halcon-25.05 百度网盘)
c#
·
ocr
·
halcon
R-G-B
10 天前
【04】OpenCV C++实战篇——实战:发票精准定位,提取指定单元格数据。(倾角计算、旋转矫正、产品定位、目标定位、OCR文字提取)
c++
·
opencv
·
ocr
·
发票精准定位
·
提取指定单元格数据
·
倾角计算
·
旋转矫正
EkihzniY
11 天前
单层 PDF 与双层 PDF:一字之差,功能大不同
pdf
·
ocr
郭庆汝
14 天前
本地服务器端部署基于大模型的通用OCR项目——dots.ocr
ocr
热门推荐
01
UV安装并设置国内源
02
DeepSeek更新!速览DeepSeek V3.1新特性
03
Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code
04
KGG转MP3工具|非KGM文件|解密音频
05
蜘蛛磁力 搜索引擎大全,如何使用蜘蛛磁力查找磁力链接
06
【2025.08.06最新版】Android Studio下载、安装及配置记录(自动下载sdk)
07
Spring 调试终于不再痛苦了
08
2025最新国内服务器可用docker源仓库地址大全(2025年8月更新)
09
Claude Code VSCode集成开发指南:AI编程助手完整配置
10
【大模型实战篇】部署GPT-OSS-120B踩得坑(vllm / ollama等推理框架)