Week 3 --Day 5:性能优化与监控经过前四天的学习,你已经能够用 LangGraph 构建功能完备的 Agent 系统,从单节点的 ReAct 循环到复杂的多智能体协作网络,代码在本地终端里跑得顺风顺水。然而当你把同样的 Agent 部署到生产环境中面对真实流量时,一系列新的问题会扑面而来。一个用户同时提交十个分析任务时,串行处理会让后面的人等到不耐烦,LLM 调用在深夜的批量跑批中悄然消耗着预算,而你甚至不知道钱花在了哪里,一场持续二十轮的对话积累了上万个 token 的上下文,某一次调用突然超出了模型的上下文窗口限制而导致整个任务崩溃