技术栈
降级策略
__土块__
20 天前
系统稳定性
·
健康检查
·
rag系统
·
ai工程
·
模型路由
·
静默故障
·
降级策略
多模型路由上线后静默降级故障复盘:从健康检查失效到动态权重补偿
2026年4月,我们上线了一套多模型路由系统,用于在RAG问答链路中根据查询复杂度、成本预算和SLA要求动态选择底层模型(如通义千问、DeepSeek、GLM等)。初期灰度阶段表现稳定,但在全量发布后第3天,监控大盘出现异常:
我是有底线的