技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
Sour
7 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端
·
pdf
·
ocr
旗讯数字
7 天前
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
大数据
·
ocr
XTIOT666
7 天前
多形态护照 OCR 读取器传输机制、识别算法与行业落地技术对比
大数据
·
人工智能
·
嵌入式硬件
·
物联网
·
ocr
天天代码码天天
7 天前
用 TensorRT 加速 PP-OCR:一套 C++ DLL + C# 调用的高性能 OCR 推理方案
c++
·
c#
·
ocr
2401_88566519
8 天前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能
·
python
·
opencv
·
计算机视觉
·
ocr
东集Seuic
8 天前
食品标签新规 GB 7718-2025 倒计时:产线“首件检验”如何用东集小码哥CRUISE Ge2-M跑通 OCR 智能核对?
大数据
·
人工智能
·
ocr
小鹏linux
8 天前
鸿蒙PC迁移:Tesseract OCR C++ 三方库鸿蒙适配全记录
c++
·
ocr
·
harmonyos
开开心心就好
8 天前
自动生成小学数学题库支持导出Word
人工智能
·
安全
·
leetcode
·
贪心算法
·
ocr
·
音视频
·
语音识别
FL1623863129
9 天前
基于C#winform使用纯opencv部署ppocrv5和ppocrv6的onnx模型进行OCR文件检测识别
opencv
·
c#
·
ocr
AI人工智能+
10 天前
智能文档抽取系统以专业的文档解析底座和大模型智能语义理解能力为核心,洞察文档的语义内涵与逻辑结构
深度学习
·
自然语言处理
·
ocr
·
文档抽取
热门推荐
01
2026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?
02
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
03
【AI】2026 年具身智能模型和世界模型总结
04
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
05
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
06
GitHub 镜像站点
07
【AI总结】2026年6月 主流国内外大模型总结
08
AI科技热点日报 | 2026年6月1日
09
AI科技热点日报 | 2026年6月22日
10
AI一周事件 · 2026-06-03 至 2026-06-09