OCR的基本概念和开源项目介绍

深度学习和OCR

  • OCR基本概念

  • 开源项目

  • [多模态大模型------OCR free](#多模态大模型——OCR free)

  • 在当今多模态大模型横行的时代,已经没有人再去研究OCR了

OCR基本概念

  • OCR是目标检测类项目,但又不完全是目标检测。它是 行级语义
  • OCR问题最有效解决方案:
  • OCR问题:
    • 第1阶段: 检测出行级文本区域
    • 第2阶段: 识别这行的文字

开源项目

多模态大模型------OCR free

相关推荐
Secede.5 小时前
TrOCR模型微调
python·深度学习·ocr
Listennnn3 天前
OCR & MLLM & Evaluation
人工智能·ocr
野生技术架构师3 天前
SpringBoot集成Tess4j :低成本解锁OCR 图片识别能力
spring boot·后端·ocr
天天代码码天天4 天前
PP-OCRv5 ubuntu20.04 OCR识别服务
ocr·pp-ocrv5·ubuntu20.04 ocr
沉到海底去吧Go5 天前
【PDF识别改名】PDF指定区域OCR识别重命名工具使用教程和注意事项
python·pdf·ocr
沉到海底去吧Go5 天前
【图片自动识别改名】识别图片中的文字并批量改名的工具,根据文字对图片批量改名,基于QT和腾讯OCR识别的实现方案
数据库·qt·ocr·图片识别自动改名·图片区域识别改名·pdf识别改名
开开心心就好6 天前
高效Excel合并拆分软件
开发语言·javascript·c#·ocr·排序算法·excel·最小二乘法
沉到海底去吧Go7 天前
【行驶证识别成表格】批量OCR行驶证识别与Excel自动化处理系统,行驶证扫描件和照片图片识别后保存为Excel表格,基于QT和华为ocr识别的实现教程
自动化·ocr·excel·行驶证识别·行驶证识别表格·批量行驶证读取表格
撞南墙者7 天前
如何让AI自己检查全文?使用OCR和LLM实现自动“全文校订”(可DIY校订规则)
人工智能·ocr
沉到海底去吧Go8 天前
【图片识别改名】如何批量将图片按图片上文字重命名?自动批量识别图片文字并命名,基于图片文字内容改名,WPF和京东ocr识别的解决方案
ocr·wpf·图片识别改名·图片识别重命名·图片内容改名