机器学习与模式识别 第十章 逻辑回归2 模拟卷及答案

第十章:Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题

总分:100分 | 建议用时:60分钟

范围:多分类(Softmax)、混淆矩阵、Precision/Recall/F1、ROC/AUC


占位图

一、单项选择题(每题2分,共20题,40分)

1. Softmax函数 pk=eak∑jeajp_k=\frac{e^{a_k}}{\sum_j e^{a_j}}pk=∑jeajeak 的作用是?

A. 将logits转为概率分布(和为1)

B. 将概率转为logits

C. 正则化模型权重

D. 减少计算量

2. One-vs-Rest (OvR) 多分类策略需要训练几个二分类器?

A. 1个

B. K个(每类一个)

C. K(K-1)/2个

D. K-1个

3. 混淆矩阵中的FP(False Positive)含义是?

A. 实际为正,预测为负

B. 实际为负,预测为正

C. 实际为正,预测为正

D. 实际为负,预测为负

4. Accuracy在类别极度不均衡时的最大问题是什么?

A. 计算太慢

B. 可以被高准确率欺骗(如全部预测多数类仍得高accuracy)

C. 不适用于二分类

D. 需要概率输出

5. Precision的公式是?

A. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

B. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN

D. TP+TNN\frac{TP+TN}{N}NTP+TN

6. Recall的公式是?

A. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN

D. FPTN+FP\frac{FP}{TN+FP}TN+FPFP

7. 关于Precision和Recall,通常正确的是?

A. 两者总是正相关

B. 两者通常负相关(提高阈值→Precision↑+Recall↓)

C. 两者完全独立

D. 只有一个有用

8. 提高分类的概率阈值会导致?

A. TP增加

B. TP不变或减少

C. FP增加

D. FN减少

9. F1 Score是什么平均?

A. 算术平均

B. 几何平均

C. 调和平均(Harmonic Mean)

D. 加权平均

10. F1 Score的公式为?

A. 2×P×RP+R\frac{2\times P\times R}{P+R}P+R2×P×R

B. P+R2\frac{P+R}{2}2P+R

C. P×R\sqrt{P\times R}P×R

D. P×RP+R\frac{P\times R}{P+R}P+RP×R

11. 垃圾邮件检测中,将正常邮件标记为垃圾邮件属于?

A. TP

B. FP

C. FN

D. TN

12. 垃圾邮件检测中,漏检一封垃圾邮件(没标为垃圾)属于?

A. TP

B. FP

C. FN

D. TN

13. ROC曲线的横轴和纵轴分别是?

A. Precision和Recall

B. FPR和TPR

C. Accuracy和F1

D. TP和FP

14. AUC=1代表什么?

A. 随机猜测

B. 完美分类器

C. 分类器完全无效

D. 过拟合

15. AUC=0.5代表什么?

A. 完美分类器

B. 随机猜测

C. 过拟合

D. 欠拟合

16. TPR(真阳性率)等于什么?

A. Precision

B. Recall

C. F1

D. Accuracy

17. FPR(假阳性率)的公式是?

A. FPTN+FP\frac{FP}{TN+FP}TN+FPFP

B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

C. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

D. TNTN+FN\frac{TN}{TN+FN}TN+FNTN

18. 当FP和FN的代价不同时,应如何选择阈值?

A. 始终选T=0.5

B. 最大化F1

C. 最小化期望损失

D. 最大化Accuracy

19. Softmax函数中,若所有aka_kak同时加一个常数c,输出概率是否改变?

A. 改变

B. 不改变(分子分母的e^c抵消)

C. 取决于c的大小

D. 只有c=0时不改变

20. 混淆矩阵中的四个数字之和等于?

A. 特征数D

B. 类别数K

C. 样本总数N

D. TP+FP


二、判断题(每题2分,共15题,30分。正确打√,错误打×)

21. Softmax是Sigmoid在多分类场景的推广。( )

22. One-vs-One策略需要训练K(K-1)/2个分类器。( )

23. 混淆矩阵不依赖于概率阈值的选择。( )

24. 在极度不平衡数据上,Accuracy可以很高但模型完全无效。( )

25. Precision和Recall总是正相关的。( )

26. 提高概率阈值会使Precision增加或不变。( )

27. F1 Score是Precision和Recall的算术平均。( )

28. ROC曲线是通过遍历不同阈值绘制的。( )

29. AUC=0.8的模型一定比AUC=0.6的模型Accuracy更高。( )

30. TPR等于Recall。( )

31. FPR越低越好,TPR越高越好。( )

32. 阈值的选择不影响Precision-Recall权衡。( )

33. F1 Score在类别不均衡时比Accuracy更有参考价值。( )

34. 垃圾邮件检测中FP比FN代价小(漏检垃圾比误标正常邮件更严重)时,应提高阈值。( )

35. 混淆矩阵是评估分类模型唯一需要的指标。( )


三、简答题(每题5分,共3题,15分)

36. 请解释为什么Accuracy在类别不均衡时可能产生误导,并结合垃圾邮件例子说明Precision和Recall如何提供了更全面的评估。

37. 请说明ROC曲线和AUC的含义。AUC=1、AUC=0.5、AUC在0.5~1之间分别代表什么?

38. 简述Softmax函数的推导逻辑:如何从两类的log-odds(对数几率)推广到K类概率分布。


四、计算题(每题5分,共3题,15分)

39. 某分类器在100个样本上的混淆矩阵如下:

预测0 预测1
实际0 70 5
实际1 10 15

计算:(1) Accuracy;(2) Precision;(3) Recall;(4) F1 Score。

40. 在题39的模型基础上,若FP的代价是FN的3倍(误报更严重),你会建议提高 还是降低概率阈值?为什么?

41. 给定三个类别的logits:a=2.0,1.0,0.1a=2.0, 1.0, 0.1a=2.0,1.0,0.1。使用Softmax计算各类别的概率。

参考:e2.0≈7.389,e1.0≈2.718,e0.1≈1.105e^{2.0}\approx7.389, e^{1.0}\approx2.718, e^{0.1}\approx1.105e2.0≈7.389,e1.0≈2.718,e0.1≈1.105


试卷结束,请认真检查。

第十章:Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题答案


一、单项选择题答案

题号 答案 解析
1 A Softmax将任意实值logits→总和为1的概率分布
2 B OvR:K个二分类器(每类vs其余)
3 B FP=实际负类被错判为正类(假阳性/误报)
4 B 不均衡时Accuracy有欺骗性(全预测多数类也高Acc)
5 B Precision=TP/(TP+FP)=预测为正中真正为正的比例
6 B Recall=TP/(TP+FN)=实际为正中被检出的比例
7 B Precision和Recall通常负相关→需权衡
8 B 提高阈值→更难预测正→TP不变或减少
9 C F1=调和平均=2PR/(P+R)
10 A F1=2PR/(P+R)F_1=2PR/(P+R)F1=2PR/(P+R)
11 B 正常→垃圾=实际负+预测正=FP
12 C 垃圾→正常=实际正+预测负=FN
13 B ROC:横轴FPR,纵轴TPR
14 B AUC=1→完美分类
15 B AUC=0.5→随机猜测(对角线)
16 B TPR=TP/(TP+FN)=Recall
17 A FPR=FP/(TN+FP)=实际负中被错判为正的比例
18 C 不等代价→最小化期望损失选阈值
19 B eak+c=eakece^{a_k+c}=e^{a_k}e^ceak+c=eakec→分子分母同乘ece^cec→抵消
20 C TP+FP+FN+TN=N

二、判断题答案

题号 答案 解析
21 Softmax(K类)=Sigmoid(Binary)的推广
22 OvO=每对类一个分类器=C(K,2)=K(K-1)/2
23 × 混淆矩阵依赖阈值→不同阈值得不同混淆矩阵
24 全预测多数类→高Acc但无用
25 × 通常负相关→需权衡
26 阈值↑→更严格→FP↓→Precision↑或不变
27 × F1是调和平均,非算术平均
28 ROC通过遍历阈值绘制(FPR,TPR)点
29 × AUC衡量排序能力不直接等于Accuracy(需选阈值)
30 TPR=Recall=TP/(TP+FN)
31 FPR↓(少误报)+TPR↑(多检出)=好
32 × 阈值决定P和R→影响权衡
33 类别不均衡时Accuracy不可靠→F1更好
34 × FP代价更大→应提高阈值→减少FP(更谨慎地预测正)
35 × 还需ROC/AUC/PR曲线/期望损失等多种评估

三、简答题参考答案

36. Accuracy陷阱

参考答案:

垃圾邮件案例:100封邮件中5封垃圾→全预测"非垃圾":

  • Accuracy=95/100=**95%**→看起来很漂亮!
  • 但垃圾邮件一个都没检测出来(Recall=0)

Precision和Recall的价值

  • Precision=TP/P→衡量预测为垃圾的准确度
  • Recall=TP/实际垃圾→衡量实际垃圾的覆盖率
  • 两者揭示Accuracy无法体现的模型缺陷
  • 在类别极度不均衡时必须同时看P和R

37. ROC与AUC

参考答案:

ROC曲线:不同阈值下(FPR, TPR)点连线。横轴FPR(误报率),纵轴TPR(检出率)。

AUC含义

AUC 含义
1 完美分类器→所有正样本排在所有负样本之前
0.5 随机猜测→ROC=对角线
0.5~1 真实分类器→越接近1越好
<0.5 比随机还差(方向反了)

优势:AUC不依赖具体阈值→衡量模型的整体排序能力


38. Softmax推导

参考答案:

二分类log-odds :ln⁡p1−p=a  ⟹  p=11+e−a=σ(a)\ln\frac{p}{1-p}=a \implies p=\frac{1}{1+e^{-a}}=\sigma(a)ln1−pp=a⟹p=1+e−a1=σ(a)

推广到K类 :对任意两类i,j:

ln⁡pipj=ai−aj  ⟹  pipj=eaieaj\ln\frac{p_i}{p_j}=a_i-a_j \implies \frac{p_i}{p_j}=\frac{e^{a_i}}{e^{a_j}}lnpjpi=ai−aj⟹pjpi=eajeai

即pi∝eaip_i\propto e^{a_i}pi∝eai。加上归一化∑kpk=1\sum_k p_k=1∑kpk=1:

pk=eak∑j=1Keajp_k=\frac{e^{a_k}}{\sum_{j=1}^{K}e^{a_j}}pk=∑j=1Keajeak


四、计算题参考答案

39. 混淆矩阵计算

(1) Accuracy

Acc=TP+TNN=15+70100=0.85=85%\text{Acc}=\frac{TP+TN}{N}=\frac{15+70}{100}=0.85=\mathbf{85\%}Acc=NTP+TN=10015+70=0.85=85%

(2) Precision

Precision=TPTP+FP=1515+5=1520=0.75\text{Precision}=\frac{TP}{TP+FP}=\frac{15}{15+5}=\frac{15}{20}=\mathbf{0.75}Precision=TP+FPTP=15+515=2015=0.75

(3) Recall

Recall=TPTP+FN=1515+10=1525=0.60\text{Recall}=\frac{TP}{TP+FN}=\frac{15}{15+10}=\frac{15}{25}=\mathbf{0.60}Recall=TP+FNTP=15+1015=2515=0.60

(4) F1 Score

F1=2×0.75×0.600.75+0.60=0.901.35=0.667F_1=\frac{2\times0.75\times0.60}{0.75+0.60}=\frac{0.90}{1.35}=\mathbf{0.667}F1=0.75+0.602×0.75×0.60=1.350.90=0.667


40. 阈值调整建议

FP代价是FN的3倍→误报比漏检更严重

→ 应提高阈值

  • 阈值↑→更难预测为正→FP减少(更少正常被判为异常)
  • 代价:可能增加FN(更多异常被漏检)
  • 但FP代价3倍于FN→减少FP比减少FN更重要

41. Softmax计算

a=2.0,1.0,0.1a=2.0, 1.0, 0.1a=2.0,1.0,0.1

ea=7.389,2.718,1.105e^{a}=7.389, 2.718, 1.105ea=7.389,2.718,1.105

∑ea=7.389+2.718+1.105=11.212\sum e^{a}=7.389+2.718+1.105=11.212∑ea=7.389+2.718+1.105=11.212

p1=7.38911.212≈0.659p_1=\frac{7.389}{11.212}\approx\mathbf{0.659}p1=11.2127.389≈0.659

p2=2.71811.212≈0.242p_2=\frac{2.718}{11.212}\approx\mathbf{0.242}p2=11.2122.718≈0.242

p3=1.10511.212≈0.099p_3=\frac{1.105}{11.212}\approx\mathbf{0.099}p3=11.2121.105≈0.099

验证:0.659+0.242+0.099=1.00.659+0.242+0.099=1.00.659+0.242+0.099=1.0 ✓。类别1概率最高→预测为类别1。


答案编制完成时间:2026年6月28日