多模态大模型学习笔记(三十八)——传统OCR技术机制:从DBNet到CRNN:吃透传统OCR两阶段范式的底层逻辑OCR(光学字符识别)是现实世界与数字世界的“文字解封器”,是文档数字化、金融票据处理、工业质检、政务档案管理等场景的核心基础技术。深度学习技术的普及,让OCR从传统五阶段串行流水线,彻底演进为**“文本检测+文本识别”**的两阶段端到端范式。其中,DBNet是文本检测领域的工业级标杆,解决了复杂场景下的文字精准定位难题;CRNN是文本识别的经典架构,实现了无需字符切分的端到端序列识别。本文将从底层原理、公式推导、架构设计、流程可视化四个维度,完整拆解这套经典范式的全部逻辑,同时还原算法演进的底层原因与技