机器学习与模式识别第十章逻辑回归2 模拟卷及答案

第十章：Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题

总分：100分 | 建议用时：60分钟

范围：多分类(Softmax)、混淆矩阵、Precision/Recall/F1、ROC/AUC

占位图

一、单项选择题（每题2分，共20题，40分）

1. Softmax函数 pk=eak∑jeajp_k=\frac{e^{a_k}}{\sum_j e^{a_j}}pk=∑jeajeak 的作用是？

A. 将logits转为概率分布（和为1）

B. 将概率转为logits

C. 正则化模型权重

D. 减少计算量

2. One-vs-Rest (OvR) 多分类策略需要训练几个二分类器？

A. 1个

B. K个（每类一个）

C. K(K-1)/2个

D. K-1个

3. 混淆矩阵中的FP（False Positive）含义是？

A. 实际为正，预测为负

B. 实际为负，预测为正

C. 实际为正，预测为正

D. 实际为负，预测为负

4. Accuracy在类别极度不均衡时的最大问题是什么？

A. 计算太慢

B. 可以被高准确率欺骗（如全部预测多数类仍得高accuracy）

C. 不适用于二分类

D. 需要概率输出

5. Precision的公式是？

A. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

B. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN

D. TP+TNN\frac{TP+TN}{N}NTP+TN

6. Recall的公式是？

A. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

C. TNTN+FP\frac{TN}{TN+FP}TN+FPTN

D. FPTN+FP\frac{FP}{TN+FP}TN+FPFP

7. 关于Precision和Recall，通常正确的是？

A. 两者总是正相关

B. 两者通常负相关（提高阈值→Precision↑+Recall↓）

C. 两者完全独立

D. 只有一个有用

8. 提高分类的概率阈值会导致？

A. TP增加

B. TP不变或减少

C. FP增加

D. FN减少

9. F1 Score是什么平均？

A. 算术平均

B. 几何平均

C. 调和平均（Harmonic Mean）

D. 加权平均

10. F1 Score的公式为？

A. 2×P×RP+R\frac{2\times P\times R}{P+R}P+R2×P×R

B. P+R2\frac{P+R}{2}2P+R

C. P×R\sqrt{P\times R}P×R

D. P×RP+R\frac{P\times R}{P+R}P+RP×R

11. 垃圾邮件检测中，将正常邮件标记为垃圾邮件属于？

A. TP

B. FP

C. FN

D. TN

12. 垃圾邮件检测中，漏检一封垃圾邮件（没标为垃圾）属于？

A. TP

B. FP

C. FN

D. TN

13. ROC曲线的横轴和纵轴分别是？

A. Precision和Recall

B. FPR和TPR

C. Accuracy和F1

D. TP和FP

14. AUC=1代表什么？

A. 随机猜测

B. 完美分类器

C. 分类器完全无效

D. 过拟合

15. AUC=0.5代表什么？

A. 完美分类器

B. 随机猜测

C. 过拟合

D. 欠拟合

16. TPR（真阳性率）等于什么？

A. Precision

B. Recall

C. F1

D. Accuracy

17. FPR（假阳性率）的公式是？

A. FPTN+FP\frac{FP}{TN+FP}TN+FPFP

B. TPTP+FN\frac{TP}{TP+FN}TP+FNTP

C. TPTP+FP\frac{TP}{TP+FP}TP+FPTP

D. TNTN+FN\frac{TN}{TN+FN}TN+FNTN

18. 当FP和FN的代价不同时，应如何选择阈值？

A. 始终选T=0.5

B. 最大化F1

C. 最小化期望损失

D. 最大化Accuracy

19. Softmax函数中，若所有aka_kak同时加一个常数c，输出概率是否改变？

A. 改变

B. 不改变（分子分母的e^c抵消）

C. 取决于c的大小

D. 只有c=0时不改变

20. 混淆矩阵中的四个数字之和等于？

A. 特征数D

B. 类别数K

C. 样本总数N

D. TP+FP

二、判断题（每题2分，共15题，30分。正确打√，错误打×）

21. Softmax是Sigmoid在多分类场景的推广。（）

22. One-vs-One策略需要训练K(K-1)/2个分类器。（）

23. 混淆矩阵不依赖于概率阈值的选择。（）

24. 在极度不平衡数据上，Accuracy可以很高但模型完全无效。（）

25. Precision和Recall总是正相关的。（）

26. 提高概率阈值会使Precision增加或不变。（）

27. F1 Score是Precision和Recall的算术平均。（）

28. ROC曲线是通过遍历不同阈值绘制的。（）

29. AUC=0.8的模型一定比AUC=0.6的模型Accuracy更高。（）

30. TPR等于Recall。（）

31. FPR越低越好，TPR越高越好。（）

32. 阈值的选择不影响Precision-Recall权衡。（）

33. F1 Score在类别不均衡时比Accuracy更有参考价值。（）

34. 垃圾邮件检测中FP比FN代价小（漏检垃圾比误标正常邮件更严重）时，应提高阈值。（）

35. 混淆矩阵是评估分类模型唯一需要的指标。（）

三、简答题（每题5分，共3题，15分）

36. 请解释为什么Accuracy在类别不均衡时可能产生误导，并结合垃圾邮件例子说明Precision和Recall如何提供了更全面的评估。

37. 请说明ROC曲线和AUC的含义。AUC=1、AUC=0.5、AUC在0.5~1之间分别代表什么？

38. 简述Softmax函数的推导逻辑：如何从两类的log-odds（对数几率）推广到K类概率分布。

四、计算题（每题5分，共3题，15分）

39. 某分类器在100个样本上的混淆矩阵如下：

	预测0	预测1
实际0	70	5
实际1	10	15

计算：(1) Accuracy；(2) Precision；(3) Recall；(4) F1 Score。

40. 在题39的模型基础上，若FP的代价是FN的3倍（误报更严重），你会建议提高还是降低概率阈值？为什么？

41. 给定三个类别的logits：a= $2.0,1.0,0.1$ a= $2.0, 1.0, 0.1$ a= $2.0,1.0,0.1$ 。使用Softmax计算各类别的概率。

参考：e2.0≈7.389,e1.0≈2.718,e0.1≈1.105e^{2.0}\approx7.389, e^{1.0}\approx2.718, e^{0.1}\approx1.105e2.0≈7.389,e1.0≈2.718,e0.1≈1.105

试卷结束，请认真检查。

第十章：Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题答案

一、单项选择题答案

题号	答案	解析
1	A	Softmax将任意实值logits→总和为1的概率分布
2	B	OvR：K个二分类器（每类vs其余）
3	B	FP=实际负类被错判为正类（假阳性/误报）
4	B	不均衡时Accuracy有欺骗性（全预测多数类也高Acc）
5	B	Precision=TP/(TP+FP)=预测为正中真正为正的比例
6	B	Recall=TP/(TP+FN)=实际为正中被检出的比例
7	B	Precision和Recall通常负相关→需权衡
8	B	提高阈值→更难预测正→TP不变或减少
9	C	F1=调和平均=2PR/(P+R)
10	A	F1=2PR/(P+R)F_1=2PR/(P+R)F1=2PR/(P+R)
11	B	正常→垃圾=实际负+预测正=FP
12	C	垃圾→正常=实际正+预测负=FN
13	B	ROC：横轴FPR，纵轴TPR
14	B	AUC=1→完美分类
15	B	AUC=0.5→随机猜测（对角线）
16	B	TPR=TP/(TP+FN)=Recall
17	A	FPR=FP/(TN+FP)=实际负中被错判为正的比例
18	C	不等代价→最小化期望损失选阈值
19	B	eak+c=eakece^{a_k+c}=e^{a_k}e^ceak+c=eakec→分子分母同乘ece^cec→抵消
20	C	TP+FP+FN+TN=N

二、判断题答案

题号	答案	解析
21	√	Softmax(K类)=Sigmoid(Binary)的推广
22	√	OvO=每对类一个分类器=C(K,2)=K(K-1)/2
23	×	混淆矩阵依赖阈值→不同阈值得不同混淆矩阵
24	√	全预测多数类→高Acc但无用
25	×	通常负相关→需权衡
26	√	阈值↑→更严格→FP↓→Precision↑或不变
27	×	F1是调和平均，非算术平均
28	√	ROC通过遍历阈值绘制(FPR,TPR)点
29	×	AUC衡量排序能力不直接等于Accuracy（需选阈值）
30	√	TPR=Recall=TP/(TP+FN)
31	√	FPR↓(少误报)+TPR↑(多检出)=好
32	×	阈值决定P和R→影响权衡
33	√	类别不均衡时Accuracy不可靠→F1更好
34	×	FP代价更大→应提高阈值→减少FP（更谨慎地预测正）
35	×	还需ROC/AUC/PR曲线/期望损失等多种评估

三、简答题参考答案

36. Accuracy陷阱

参考答案：

垃圾邮件案例：100封邮件中5封垃圾→全预测"非垃圾"：

Accuracy=95/100=**95%**→看起来很漂亮！
但垃圾邮件一个都没检测出来（Recall=0）

Precision和Recall的价值：

Precision=TP/P→衡量预测为垃圾的准确度
Recall=TP/实际垃圾→衡量实际垃圾的覆盖率
两者揭示Accuracy无法体现的模型缺陷
在类别极度不均衡时必须同时看P和R

37. ROC与AUC

参考答案：

ROC曲线：不同阈值下(FPR, TPR)点连线。横轴FPR（误报率），纵轴TPR（检出率）。

AUC含义：

AUC	含义
1	完美分类器→所有正样本排在所有负样本之前
0.5	随机猜测→ROC=对角线
0.5~1	真实分类器→越接近1越好
<0.5	比随机还差（方向反了）

优势：AUC不依赖具体阈值→衡量模型的整体排序能力。

38. Softmax推导

参考答案：

二分类log-odds ：ln⁡p1−p=a ⟹ p=11+e−a=σ(a)\ln\frac{p}{1-p}=a \implies p=\frac{1}{1+e^{-a}}=\sigma(a)ln1−pp=a⟹p=1+e−a1=σ(a)

推广到K类 ：对任意两类i,j：

ln⁡pipj=ai−aj ⟹ pipj=eaieaj\ln\frac{p_i}{p_j}=a_i-a_j \implies \frac{p_i}{p_j}=\frac{e^{a_i}}{e^{a_j}}lnpjpi=ai−aj⟹pjpi=eajeai

即pi∝eaip_i\propto e^{a_i}pi∝eai。加上归一化∑kpk=1\sum_k p_k=1∑kpk=1：

pk=eak∑j=1Keajp_k=\frac{e^{a_k}}{\sum_{j=1}^{K}e^{a_j}}pk=∑j=1Keajeak

四、计算题参考答案

39. 混淆矩阵计算

(1) Accuracy

Acc=TP+TNN=15+70100=0.85=85%\text{Acc}=\frac{TP+TN}{N}=\frac{15+70}{100}=0.85=\mathbf{85\%}Acc=NTP+TN=10015+70=0.85=85%

(2) Precision

Precision=TPTP+FP=1515+5=1520=0.75\text{Precision}=\frac{TP}{TP+FP}=\frac{15}{15+5}=\frac{15}{20}=\mathbf{0.75}Precision=TP+FPTP=15+515=2015=0.75

(3) Recall

Recall=TPTP+FN=1515+10=1525=0.60\text{Recall}=\frac{TP}{TP+FN}=\frac{15}{15+10}=\frac{15}{25}=\mathbf{0.60}Recall=TP+FNTP=15+1015=2515=0.60

(4) F1 Score

F1=2×0.75×0.600.75+0.60=0.901.35=0.667F_1=\frac{2\times0.75\times0.60}{0.75+0.60}=\frac{0.90}{1.35}=\mathbf{0.667}F1=0.75+0.602×0.75×0.60=1.350.90=0.667

40. 阈值调整建议

FP代价是FN的3倍→误报比漏检更严重。

→ 应提高阈值！

阈值↑→更难预测为正→FP减少（更少正常被判为异常）
代价：可能增加FN（更多异常被漏检）
但FP代价3倍于FN→减少FP比减少FN更重要

41. Softmax计算

a= $2.0,1.0,0.1$ a= $2.0, 1.0, 0.1$ a= $2.0,1.0,0.1$

ea= $7.389,2.718,1.105$ e^{a}= $7.389, 2.718, 1.105$ ea= $7.389,2.718,1.105$

∑ea=7.389+2.718+1.105=11.212\sum e^{a}=7.389+2.718+1.105=11.212∑ea=7.389+2.718+1.105=11.212

p1=7.38911.212≈0.659p_1=\frac{7.389}{11.212}\approx\mathbf{0.659}p1=11.2127.389≈0.659

p2=2.71811.212≈0.242p_2=\frac{2.718}{11.212}\approx\mathbf{0.242}p2=11.2122.718≈0.242

p3=1.10511.212≈0.099p_3=\frac{1.105}{11.212}\approx\mathbf{0.099}p3=11.2121.105≈0.099

验证：0.659+0.242+0.099=1.00.659+0.242+0.099=1.00.659+0.242+0.099=1.0 ✓。类别1概率最高→预测为类别1。

答案编制完成时间：2026年6月28日

机器学习与模式识别 第十章 逻辑回归2 模拟卷及答案

第十章：Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题

一、单项选择题（每题2分，共20题，40分）

二、判断题（每题2分，共15题，30分。正确打√，错误打×）

三、简答题（每题5分，共3题，15分）

四、计算题（每题5分，共3题，15分）

第十章：Logistic Regression (2) --- Multi-Class & Model Evaluation --- 单元习题答案

一、单项选择题答案

二、判断题答案

三、简答题参考答案

36. Accuracy陷阱

37. ROC与AUC

38. Softmax推导

四、计算题参考答案

39. 混淆矩阵计算

40. 阈值调整建议

41. Softmax计算

机器学习与模式识别第十章逻辑回归2 模拟卷及答案