Correlation Matrix of Model Logits

1. Correlation Matrix of Model Logits 是说明什么的?

它反映的是:一个模型内部,不同类别之间的输出相关性结构

👇 举例:

你有一个模型(无论是 teacher 还是 student),在测试集中预测了很多图像(比如 N=1000 张),每张图输出 [logit_0, logit_1, logit_2, logit_3] 四个类别得分。

  • 你把所有图像的 logits 拿出来做相关性分析,计算的是:

    Corr[i][j] = PearsonCorr(logit_i, logit_j)

    也就是:

    在所有图像中,第 i 类和第 j 类的打分,是否同步升高、降低。


📌 这个矩阵说明了什么?

行为 说明
Corrij ≈ 1 模型认为 i 和 j 类经常一起出现(或难以区分)
Corrij ≈ -1 i 类高时,j 类低,说明它们是强对立关系
Corrij ≈ 0 没有明显相关性

🧠 举例(实际含义):

比如在皮肤病分类中:

  • 类别 0(黑头) 和 类别 1(粉刺)有高相关性,说明模型认为它们容易混淆;

  • 类别 0 和 类别 3(脓疱)无相关,说明它们形态差异大,模型容易分开。

✅ 2. Difference of Correlation Matrices (Student - Teacher) 是说明什么的?

它反映的是:学生模型与教师模型在类别结构建模上的差距

也就是,我们不是关心"你分类准不准",而是看:

"你有没有模仿到老师对不同类别之间的理解方式?"


📌 这个差值矩阵说明了什么?

你计算的是:

diff = corr_student - corr_teacher

  • 如果 diff[i][j] ≈ 0:说明 student 和 teacher 对 i类 和 j类 的语义关系 保持一致;

  • 如果 diff[i][j] ≈ 正/负值:说明 student 的理解方式和 teacher 不一致,可能产生歧义、结构偏移。


✅ 3. 对比意义是什么?为什么论文要用这个?

类型 用途 常用于分析
Correlation Matrix(单模型) 看一个模型对类别关系的感知是否合理、混淆 用于观察模型"语义结构"能力
Difference of Corr Matrix(两个模型) 对比模型结构迁移是否成功 知识蒸馏、结构对齐分析
相关推荐
血小溅23 分钟前
三大 AI 编码框架深度对比:GSD vs OpenSpec vs Superpowers
人工智能·后端
武子康4 小时前
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排
人工智能·langchain·llm
武子康4 小时前
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)
人工智能·openai·claude
aqi005 小时前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
混沌福王6 小时前
Electron三端统一架构:运行时Adapter、IPC能力边界与分层设计
人工智能·agent·ai编程
说了很好6 小时前
马尔可夫扩散链+损失函数推导,手把手实现原生Diffusion
人工智能
聂二AI落地内参6 小时前
合同抽取别停在 JSON:标准规则和交易日历才是硬仗
人工智能
冬哥聊AI7 小时前
滴滴Agent岗二面:RAG 系统的 LLM 幻觉怎么治?从两类根源讲到四道防线
人工智能
lyshlc7 小时前
# AI Agent的推迟判定协议:不确定性下的最优策略
人工智能