深度学习和OCR
OCR基本概念
- OCR是目标检测类项目,但又不完全是目标检测。它是 行级语义
- OCR问题最有效解决方案:
- OCR问题:
- 第1阶段: 检测出行级文本区域
- 第2阶段: 识别这行的文字
开源项目
- 做的最好的开源项目:PaddleOCR
- 也可以在 ModelScope上面找到开源项目:
多模态大模型------OCR free
- 文心一言:https://yiyan.baidu.com/
- 通义千问:https://tongyi.aliyun.com/qianwen/
- 大模型已经基本统一 LP ,即将统一 CV 。所以,拥抱大模型吧。