技术栈
二阶段检索
还是码字踏实
21 天前
多模态数据
·
pymupdf + 截图策略
·
以页为粒度切块
·
三种池化策略
·
qdrant 三层向量集合设计
·
二阶段检索
·
多查询并行扩展
开源项目解读:multi-modal-rag-with-colpali 全栈多模态 RAG 工程深度拆解
在企业知识管理场景中,文档的价值往往不仅在于文字本身,更在于图表、表格、布局、手写批注、扫描件等视觉信息。传统 RAG 方案(PDF → OCR 文本 → 文本向量检索)面临三重硬伤:
我是有底线的