用LangChain+FastAPI构建私有知识库踩坑实录:这3个问题让我排查了整整8小时凌晨一点半,手机疯狂震动,运维群消息炸了:“知识库问答接口超时,用户已经开始骂娘了”。打开 Grafana 一看,P99 延迟飙到 34 秒,错误率 40%。这套基于 LangChain 的 RAG 系统是我两周前拍胸脯上线的,当时在 Colab 里跑 Demo 丝滑得一批,谁知道搬到生产环境会崩成这样。接下来的 8 小时,我逐层剥开 LangChain 优雅抽象的外衣,找到了三个能直接把服务干趴的致命问题。