技术栈
动手RAG: ocr调研
YueTann
2024-07-08 18:14
对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
OCR
tesseract
ppocr
mmocr
还有诸如
chineseocr_lite
darknet-ocr
https://blog.csdn.net/CHYabc123456hh/article/details/107846268
easyocr
OCR包含几类,
自然场景中的文字识别,文档中的文字识别
pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)
表格识别
部署
pdf解析
文档解析
参考
https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR技术导论.ipynb
ocr
上一篇:
深度学习2 线性回归和非线性回归
下一篇:
深度学习1
相关推荐
AI人工智能+
4 天前
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?
深度学习
·
ocr
·
食品经营许可证识别
摆烂小白敲代码
4 天前
腾讯云智能结构化OCR在物流行业的应用
大数据
·
人工智能
·
经验分享
·
ocr
·
腾讯云
开开心心就好
8 天前
免费音频转文字工具,绿色版离线多模型可用
人工智能
·
windows
·
计算机视觉
·
计算机外设
·
ocr
·
excel
·
语音识别
开开心心_Every
9 天前
全屏程序切换工具,激活选中窗口快速切换
linux
·
运维
·
服务器
·
pdf
·
ocr
·
测试用例
·
模块测试
2401_83623586
9 天前
名片识别产品:技术要点与应用场景深度解析
人工智能
·
科技
·
深度学习
·
ocr
njsgcs
11 天前
glm-ocr ollama使用 python
ocr
开开心心就好
11 天前
轻松鼠标连, 自定义区域模仿人手点击
人工智能
·
windows
·
物联网
·
计算机视觉
·
计算机外设
·
ocr
·
excel
littleshimmer
11 天前
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)
ocr
AI周红伟
13 天前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建
大数据
·
人工智能
·
大模型
·
ocr
·
智能体
·
seedance
kongba007
15 天前
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。
大数据
·
ocr
热门推荐
01
GitHub 镜像站点
02
【OpenClaw 本地实战 Ep.3】突破瓶颈:强制修改 openclaw.json 解锁 32k 上下文记忆
03
OpenClaw 使用和管理 MCP 完全指南
04
OpenClaw + 飞书(Feishu)环境搭建指南
05
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤
06
OpenClaw优化飞书API 额度已耗尽问题
07
Window 10部署openclaw报错node.exe : npm error code 128
08
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
09
OpenClaw 接入阿里云百炼 Coding Plan 指南
10
UV安装并设置国内源