技术栈
agent评测
玉面大蛟龙
3 小时前
ai
·
agent
·
agent评测
·
harness ai
可复用的 Agent 评测体系:方法论与实践
Agent 评测体系是一套标准化的质量度量方法论——它定义了“好的 Agent 长什么样”、“如何衡量好不好”、“如何持续变得更好”。
我是有底线的