技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
明知道的博客
2 天前
解决WSL环境下DeepSeek-OCR运行时内存不足问题
python
·
ocr
·
deepseek
·
deepseek-ocr
模型启动机
3 天前
DeepSeek OCR vs Qwen-3 VL vs Mistral OCR:谁更胜一筹?
人工智能
·
ai
·
大模型
·
ocr
·
deepseek
AI人工智能+
3 天前
文档抽取技术结合OCR、NLP和计算机视觉,能智能提取PDF、扫描件等版式文档中的结构化数据
pdf
·
ocr
·
文档抽取
旗讯数字
4 天前
纸质手写表格二次录入效率低?旗讯 OCR 技术方案与行业落地实践
ocr
Olafur_zbj
4 天前
【AI】使用OCR处理pdf
数据库
·
pdf
·
ocr
码二哥
4 天前
借助豆包将vllm推理deepseek-ocr改成web服务访问
ocr
·
fastapi
·
vllm
·
豆包
·
deepseek-ocr
还是码字踏实
4 天前
基于BM25的金融文档智能解析:基于OCR和紧凑型视觉语言模型的多阶段字段提取技术深度解读
金融
·
ocr
·
图像预处理
·
bm25页面预检索
·
紧凑型视觉语言模型vlm
·
多阶段金融文档解析框架
旗讯数字
4 天前
旗讯 OCR 技术解析:金融行业手写表格识别方案与系统集成实践
大数据
·
金融
·
ocr
萧鼎
5 天前
Python PyTesseract OCR :从基础到项目实战
开发语言
·
python
·
ocr
七十二计
5 天前
高效视频抽帧与文字识别(OCR)技术体系详解
ocr
·
音视频
热门推荐
01
GitHub 镜像站点
02
【保姆级教程】免费使用Gemini3的5种方法!免翻墙/国内直连
03
BongoCat - 跨平台键盘猫动画工具
04
UV安装并设置国内源
05
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
06
Google Antigravity:无法登录?早期错误、登录修复和用户反馈指南
07
Linux下V2Ray安装配置指南
08
全球最强模型Grok4,国内已可免费使用!(附教程)
09
Spring Boot 4.0 发布总结:新特性、依赖变更与升级指南
10
Labelme从安装到标注:零基础完整指南