技术栈

故障治理

__土块__
22 天前
故障治理·系统稳定性·会话管理·ai工程·生产实践·终态一致性·静默故障
AI 会话记忆模块静默失效治理:从状态丢失到分层终态校验的工程实践我们在 2025 年底上线了一个面向企业客服场景的 AI 会话系统,支持多轮对话、上下文记忆、工具调用和知识库检索。系统设计上采用分层架构:前端会话层、记忆管理模块、RAG 检索引擎、工具调度器和模型路由层。初期测试表现良好,但在灰度放量后,用户反馈“系统好像忘了我说过什么”,尤其在超过 5 轮对话后,AI 回复明显偏离上下文。
不思jo
3 年前
故障治理
故障治理:如何进行故障复盘故障复盘的重要性无需多说,每一次故障都是宝贵的学习机会,本人接手故障复盘工作已经半年有余,从一开始的手足无措,慢慢变得游刃有余。以下内容为本人从网上查阅学习多个专家经验,并结合工作经历总结而来,仅供参考。
我是有底线的