第十章:Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题
总分:100分 | 建议用时:60分钟
范围:多分类(Softmax)、混淆矩阵、Precision/Recall/F1、ROC/AUC
占位图

一、单项选择题(每题2分,共20题,40分)
1. Softmax函数 pk=eak∑jeajp_k=\frac{e^{a_k}}{\sum_j e^{a_j}}pk=∑jeajeak 的作用是?
A. 将logits转为概率分布(和为1)
B. 将概率转为logits
C. 正则化模型权重
D. 减少计算量
2. One-vs-Rest (OvR) 多分类策略需要训练几个二分类器?
A. 1个
B. K个(每类一个)
C. K(K-1)/2个
D. K-1个
3. 混淆矩阵中的FP(False Positive)含义是?
A. 实际为正,预测为负
B. 实际为负,预测为正
C. 实际为正,预测为正
D. 实际为负,预测为负
4. Accuracy在类别极度不均衡时的最大问题是什么?
A. 计算太慢
B. 可以被高准确率欺骗(如全部预测多数类仍得高accuracy)
C. 不适用于二分类
D. 需要概率输出
5. Precision的公式是?
A. TPTP+FN\frac{TP}{TP+FN}TP+FNTP
B. TPTP+FP\frac{TP}{TP+FP}TP+FPTP
C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN
D. TP+TNN\frac{TP+TN}{N}NTP+TN
6. Recall的公式是?
A. TPTP+FP\frac{TP}{TP+FP}TP+FPTP
B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP
C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN
D. FPTN+FP\frac{FP}{TN+FP}TN+FPFP
7. 关于Precision和Recall,通常正确的是?
A. 两者总是正相关
B. 两者通常负相关(提高阈值→Precision↑+Recall↓)
C. 两者完全独立
D. 只有一个有用
8. 提高分类的概率阈值会导致?
A. TP增加
B. TP不变或减少
C. FP增加
D. FN减少
9. F1 Score是什么平均?
A. 算术平均
B. 几何平均
C. 调和平均(Harmonic Mean)
D. 加权平均
10. F1 Score的公式为?
A. 2×P×RP+R\frac{2\times P\times R}{P+R}P+R2×P×R
B. P+R2\frac{P+R}{2}2P+R
C. P×R\sqrt{P\times R}P×R
D. P×RP+R\frac{P\times R}{P+R}P+RP×R
11. 垃圾邮件检测中,将正常邮件标记为垃圾邮件属于?
A. TP
B. FP
C. FN
D. TN
12. 垃圾邮件检测中,漏检一封垃圾邮件(没标为垃圾)属于?
A. TP
B. FP
C. FN
D. TN
13. ROC曲线的横轴和纵轴分别是?
A. Precision和Recall
B. FPR和TPR
C. Accuracy和F1
D. TP和FP
14. AUC=1代表什么?
A. 随机猜测
B. 完美分类器
C. 分类器完全无效
D. 过拟合
15. AUC=0.5代表什么?
A. 完美分类器
B. 随机猜测
C. 过拟合
D. 欠拟合
16. TPR(真阳性率)等于什么?
A. Precision
B. Recall
C. F1
D. Accuracy
17. FPR(假阳性率)的公式是?
A. FPTN+FP\frac{FP}{TN+FP}TN+FPFP
B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP
C. TPTP+FP\frac{TP}{TP+FP}TP+FPTP
D. TNTN+FN\frac{TN}{TN+FN}TN+FNTN
18. 当FP和FN的代价不同时,应如何选择阈值?
A. 始终选T=0.5
B. 最大化F1
C. 最小化期望损失
D. 最大化Accuracy
19. Softmax函数中,若所有aka_kak同时加一个常数c,输出概率是否改变?
A. 改变
B. 不改变(分子分母的e^c抵消)
C. 取决于c的大小
D. 只有c=0时不改变
20. 混淆矩阵中的四个数字之和等于?
A. 特征数D
B. 类别数K
C. 样本总数N
D. TP+FP
二、判断题(每题2分,共15题,30分。正确打√,错误打×)
21. Softmax是Sigmoid在多分类场景的推广。( )
22. One-vs-One策略需要训练K(K-1)/2个分类器。( )
23. 混淆矩阵不依赖于概率阈值的选择。( )
24. 在极度不平衡数据上,Accuracy可以很高但模型完全无效。( )
25. Precision和Recall总是正相关的。( )
26. 提高概率阈值会使Precision增加或不变。( )
27. F1 Score是Precision和Recall的算术平均。( )
28. ROC曲线是通过遍历不同阈值绘制的。( )
29. AUC=0.8的模型一定比AUC=0.6的模型Accuracy更高。( )
30. TPR等于Recall。( )
31. FPR越低越好,TPR越高越好。( )
32. 阈值的选择不影响Precision-Recall权衡。( )
33. F1 Score在类别不均衡时比Accuracy更有参考价值。( )
34. 垃圾邮件检测中FP比FN代价小(漏检垃圾比误标正常邮件更严重)时,应提高阈值。( )
35. 混淆矩阵是评估分类模型唯一需要的指标。( )
三、简答题(每题5分,共3题,15分)
36. 请解释为什么Accuracy在类别不均衡时可能产生误导,并结合垃圾邮件例子说明Precision和Recall如何提供了更全面的评估。
37. 请说明ROC曲线和AUC的含义。AUC=1、AUC=0.5、AUC在0.5~1之间分别代表什么?
38. 简述Softmax函数的推导逻辑:如何从两类的log-odds(对数几率)推广到K类概率分布。
四、计算题(每题5分,共3题,15分)
39. 某分类器在100个样本上的混淆矩阵如下:
| 预测0 | 预测1 | |
|---|---|---|
| 实际0 | 70 | 5 |
| 实际1 | 10 | 15 |
计算:(1) Accuracy;(2) Precision;(3) Recall;(4) F1 Score。
40. 在题39的模型基础上,若FP的代价是FN的3倍(误报更严重),你会建议提高 还是降低概率阈值?为什么?
41. 给定三个类别的logits:a=2.0,1.0,0.1a=2.0, 1.0, 0.1a=2.0,1.0,0.1。使用Softmax计算各类别的概率。
参考:e2.0≈7.389,e1.0≈2.718,e0.1≈1.105e^{2.0}\approx7.389, e^{1.0}\approx2.718, e^{0.1}\approx1.105e2.0≈7.389,e1.0≈2.718,e0.1≈1.105
试卷结束,请认真检查。
第十章:Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题答案
一、单项选择题答案
| 题号 | 答案 | 解析 |
|---|---|---|
| 1 | A | Softmax将任意实值logits→总和为1的概率分布 |
| 2 | B | OvR:K个二分类器(每类vs其余) |
| 3 | B | FP=实际负类被错判为正类(假阳性/误报) |
| 4 | B | 不均衡时Accuracy有欺骗性(全预测多数类也高Acc) |
| 5 | B | Precision=TP/(TP+FP)=预测为正中真正为正的比例 |
| 6 | B | Recall=TP/(TP+FN)=实际为正中被检出的比例 |
| 7 | B | Precision和Recall通常负相关→需权衡 |
| 8 | B | 提高阈值→更难预测正→TP不变或减少 |
| 9 | C | F1=调和平均=2PR/(P+R) |
| 10 | A | F1=2PR/(P+R)F_1=2PR/(P+R)F1=2PR/(P+R) |
| 11 | B | 正常→垃圾=实际负+预测正=FP |
| 12 | C | 垃圾→正常=实际正+预测负=FN |
| 13 | B | ROC:横轴FPR,纵轴TPR |
| 14 | B | AUC=1→完美分类 |
| 15 | B | AUC=0.5→随机猜测(对角线) |
| 16 | B | TPR=TP/(TP+FN)=Recall |
| 17 | A | FPR=FP/(TN+FP)=实际负中被错判为正的比例 |
| 18 | C | 不等代价→最小化期望损失选阈值 |
| 19 | B | eak+c=eakece^{a_k+c}=e^{a_k}e^ceak+c=eakec→分子分母同乘ece^cec→抵消 |
| 20 | C | TP+FP+FN+TN=N |
二、判断题答案
| 题号 | 答案 | 解析 |
|---|---|---|
| 21 | √ | Softmax(K类)=Sigmoid(Binary)的推广 |
| 22 | √ | OvO=每对类一个分类器=C(K,2)=K(K-1)/2 |
| 23 | × | 混淆矩阵依赖阈值→不同阈值得不同混淆矩阵 |
| 24 | √ | 全预测多数类→高Acc但无用 |
| 25 | × | 通常负相关→需权衡 |
| 26 | √ | 阈值↑→更严格→FP↓→Precision↑或不变 |
| 27 | × | F1是调和平均,非算术平均 |
| 28 | √ | ROC通过遍历阈值绘制(FPR,TPR)点 |
| 29 | × | AUC衡量排序能力不直接等于Accuracy(需选阈值) |
| 30 | √ | TPR=Recall=TP/(TP+FN) |
| 31 | √ | FPR↓(少误报)+TPR↑(多检出)=好 |
| 32 | × | 阈值决定P和R→影响权衡 |
| 33 | √ | 类别不均衡时Accuracy不可靠→F1更好 |
| 34 | × | FP代价更大→应提高阈值→减少FP(更谨慎地预测正) |
| 35 | × | 还需ROC/AUC/PR曲线/期望损失等多种评估 |
三、简答题参考答案
36. Accuracy陷阱
参考答案:
垃圾邮件案例:100封邮件中5封垃圾→全预测"非垃圾":
- Accuracy=95/100=**95%**→看起来很漂亮!
- 但垃圾邮件一个都没检测出来(Recall=0)
Precision和Recall的价值:
- Precision=TP/P→衡量预测为垃圾的准确度
- Recall=TP/实际垃圾→衡量实际垃圾的覆盖率
- 两者揭示Accuracy无法体现的模型缺陷
- 在类别极度不均衡时必须同时看P和R
37. ROC与AUC
参考答案:
ROC曲线:不同阈值下(FPR, TPR)点连线。横轴FPR(误报率),纵轴TPR(检出率)。
AUC含义:
| AUC | 含义 |
|---|---|
| 1 | 完美分类器→所有正样本排在所有负样本之前 |
| 0.5 | 随机猜测→ROC=对角线 |
| 0.5~1 | 真实分类器→越接近1越好 |
| <0.5 | 比随机还差(方向反了) |
优势:AUC不依赖具体阈值→衡量模型的整体排序能力。
38. Softmax推导
参考答案:
二分类log-odds :lnp1−p=a ⟹ p=11+e−a=σ(a)\ln\frac{p}{1-p}=a \implies p=\frac{1}{1+e^{-a}}=\sigma(a)ln1−pp=a⟹p=1+e−a1=σ(a)
推广到K类 :对任意两类i,j:
lnpipj=ai−aj ⟹ pipj=eaieaj\ln\frac{p_i}{p_j}=a_i-a_j \implies \frac{p_i}{p_j}=\frac{e^{a_i}}{e^{a_j}}lnpjpi=ai−aj⟹pjpi=eajeai
即pi∝eaip_i\propto e^{a_i}pi∝eai。加上归一化∑kpk=1\sum_k p_k=1∑kpk=1:
pk=eak∑j=1Keajp_k=\frac{e^{a_k}}{\sum_{j=1}^{K}e^{a_j}}pk=∑j=1Keajeak
四、计算题参考答案
39. 混淆矩阵计算
(1) Accuracy
Acc=TP+TNN=15+70100=0.85=85%\text{Acc}=\frac{TP+TN}{N}=\frac{15+70}{100}=0.85=\mathbf{85\%}Acc=NTP+TN=10015+70=0.85=85%
(2) Precision
Precision=TPTP+FP=1515+5=1520=0.75\text{Precision}=\frac{TP}{TP+FP}=\frac{15}{15+5}=\frac{15}{20}=\mathbf{0.75}Precision=TP+FPTP=15+515=2015=0.75
(3) Recall
Recall=TPTP+FN=1515+10=1525=0.60\text{Recall}=\frac{TP}{TP+FN}=\frac{15}{15+10}=\frac{15}{25}=\mathbf{0.60}Recall=TP+FNTP=15+1015=2515=0.60
(4) F1 Score
F1=2×0.75×0.600.75+0.60=0.901.35=0.667F_1=\frac{2\times0.75\times0.60}{0.75+0.60}=\frac{0.90}{1.35}=\mathbf{0.667}F1=0.75+0.602×0.75×0.60=1.350.90=0.667
40. 阈值调整建议
FP代价是FN的3倍→误报比漏检更严重。
→ 应提高阈值!
- 阈值↑→更难预测为正→FP减少(更少正常被判为异常)
- 代价:可能增加FN(更多异常被漏检)
- 但FP代价3倍于FN→减少FP比减少FN更重要
41. Softmax计算
a=2.0,1.0,0.1a=2.0, 1.0, 0.1a=2.0,1.0,0.1
ea=7.389,2.718,1.105e^{a}=7.389, 2.718, 1.105ea=7.389,2.718,1.105
∑ea=7.389+2.718+1.105=11.212\sum e^{a}=7.389+2.718+1.105=11.212∑ea=7.389+2.718+1.105=11.212
p1=7.38911.212≈0.659p_1=\frac{7.389}{11.212}\approx\mathbf{0.659}p1=11.2127.389≈0.659
p2=2.71811.212≈0.242p_2=\frac{2.718}{11.212}\approx\mathbf{0.242}p2=11.2122.718≈0.242
p3=1.10511.212≈0.099p_3=\frac{1.105}{11.212}\approx\mathbf{0.099}p3=11.2121.105≈0.099
验证:0.659+0.242+0.099=1.00.659+0.242+0.099=1.00.659+0.242+0.099=1.0 ✓。类别1概率最高→预测为类别1。
答案编制完成时间:2026年6月28日