技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
兮℡檬,
6 小时前
文档ocr
ocr
开开心心就好
1 天前
绿色版PDF多功能工具,支持编辑转换
人工智能
·
windows
·
pdf
·
ocr
·
excel
·
语音识别
·
harmonyos
余俊晖
1 天前
多模态文档解析最新开源进展:2B参数FireRed-OCR模型方法、数据
人工智能
·
自然语言处理
·
ocr
·
多模态
余俊晖
1 天前
多模态大模型文档解析开源新进展:Qianfan-OCR模型架构、数据引擎、训练方法
架构
·
ocr
ai_coder_ai
2 天前
如何使用ocr来实现自动化脚本?
ocr
·
autojs
·
自动化脚本
·
冰狐智能辅助
·
easyclick
虚幻如影
2 天前
Tesseract-OCR 引擎安装
python
·
ocr
一顿能吃五大海碗啊啊啊
3 天前
OCR大模型如何解决多页文档的问题
ocr
·
ocr大模型
·
ocr长文档
·
ocr大模型面试
专家大圣
3 天前
告别付费 OCR!PaddleOCR-VL + cpolar,打造专属便携识别工具✨
网络
·
ocr
·
内网穿透
·
cpolar
AI人工智能+
3 天前
网约车运输证识别技术:深度融合计算机视觉与自然语言处理技术,实现对运输证全字段的高精度定位、识别与结构化提取
深度学习
·
计算机视觉
·
ocr
·
网约车运输证识别
Pyeako
3 天前
基于Qt和PaddleOCR的工业视觉识别报警系统开发
人工智能
·
python
·
深度学习
·
数码相机
·
opencv
·
ocr
·
pyqt5
热门推荐
01
GitHub 镜像站点
02
Qwen3.5 开源全解析:从 0.8B 到 397B,代际升级 + 全场景选型指南
03
围棋-html版本
04
小黑课堂计算机二级WPSoffice题库软件下载安装教程(2026年3月最新版)
05
班级宠物园部署指南
06
OpenClaw 使用和管理 MCP 完全指南
07
OpenClaw Control UI安全上下文访问配置
08
AI 编程三剑客:Spec-Kit、OpenSpec、Superpowers 深度对比与实战指南
09
UV安装并设置国内源
10
“wsl --install -d Ubuntu-22.04”下载慢,中国地区离线安装 Ubuntu 22.04 WSL方法(亲测2025年5月6日)