【AI Daily】每日Arxiv论文研读Top5 | 2026-05-19(周2)🔗 https://arxiv.org/abs/2605.05600 定位:AI时代 UX 评估框架系统性重构——传统 SUS/NPS 等指标在 AI 产品中的假设已被打破,本文提出统计视角下的新评估体系。 关键数据/结论:传统 UX 指标(如任务完成时间、满意度量表)在 AI 驱动产品中存在结构性偏差;AI 的非确定性输出使可重复性测试失效,需要概率性评估框架替代。 为什么重要:这是2026年5月最新arXiv论文,直接回应产品团队"AI产品怎么评估好坏"的核心困惑,是做AI产品决策的方法论基础。