OCR的基本概念和开源项目介绍

深度学习和OCR

  • OCR基本概念

  • 开源项目

  • [多模态大模型------OCR free](#多模态大模型——OCR free)

  • 在当今多模态大模型横行的时代,已经没有人再去研究OCR了

OCR基本概念

  • OCR是目标检测类项目,但又不完全是目标检测。它是 行级语义
  • OCR问题最有效解决方案:
  • OCR问题:
    • 第1阶段: 检测出行级文本区域
    • 第2阶段: 识别这行的文字

开源项目

多模态大模型------OCR free

相关推荐
王莎莎-MinerU16 小时前
面向大模型工作流的文档解析:从OCR到MinerU的深度技术指南
网络·ocr
ai_coder_ai19 小时前
使用ocr实现自动化脚本
运维·自动化·ocr
番石榴AI21 小时前
JiaJiaOCR-2.2.0:面向Java ocr的开源库
java·ocr
企业知识库布道者21 小时前
从 OCR 到文档结构理解:MinerU-Popo 对 RAG 文档解析链路的补全
人工智能·ocr·私有化部署·知识库·rag·企业知识库
DevOpenClub21 小时前
用 OCR、PDF 转文本和摘要接口构建 RAG 文档入库 Agent
数据库·pdf·ocr
动能小子ohhh1 天前
DocForge平台的设计与开发--文件上传接口的实现
开发语言·人工智能·python·langchain·ocr·fastapi
jiajia_lisa2 天前
供应链对账场景|高效核对往来票据,解决对账难题
ocr
AI人工智能+2 天前
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
2501_907136822 天前
翻译+OCR工具 STranslate
ocr·软件需求
2401_836235862 天前
从“扫卡“到“懂卡“:OCR银行卡识别产品的发展趋势与技术难点
人工智能·科技·深度学习·ocr·生活