技术栈

相似度阈值

__土块__
3 小时前
向量检索·embedding微调·rag系统·文档切分·分层召回·相似度阈值·上下文拼装
RAG 检索查不准的工程归因:从向量对齐到分层召回的架构取舍在 2026 年初上线的某金融合规问答系统中,RAG 模块持续出现“用户问 A,系统答 B”的现象。典型场景如用户查询“2025 年反洗钱新规对跨境转账的影响”,系统却返回了“2023 年境内支付结算管理办法”相关内容。初期排查聚焦于 prompt 优化和相似度阈值调整,但效果有限。进一步观察发现,问题并非集中在单一环节,而是贯穿了从文档入库到最终回答生成的全链路。
我是有底线的