Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台在前一篇文章 Litefuse 正式发布:Agent 可观测与效果评估, 比 Langfuse 成本低 88% 中,我们介绍了为什么 Agent 时代需要新的方法论 EDD(Evaluation Driven Development),通过 “观测-评估-优化” 闭环来应对大模型幻觉、路径规划走偏、工具调用失败、上下文腐化等 Agent 特有的不确定性问题,Litefuse 如何把 Trace 采集、可视化分析、数据集管理、实验运行与评估这一整套实践 EDD 方法论的能力产品化。