本篇为智能科学与技术-专业课机器学习-26年期中考试试题(个人回忆版),虽然现在忙着考研,但是想到机器学习这门课网上还没有真题,复习就只能看PPT、课本,如果我做了,下一届学弟学妹们就可以有真题可以参考,那也算做了一件好事,毕竟计算机的灵魂就是开源
机器学习期中考试
一、判断选择
- 决策树和神经网络训练中都会有过拟合的问题(有点忘了原题了主要就是过拟合)
- 决策树选择属性时,信息增益率比信息增益更有效
- 单层感知机无法正确处理异或问题
- 过拟合相关判断
- Bootstrap方法
A 从n个属性中有放回选取n´个属性
B 从n个属性中无放回选取n´个属性
C 从m个数据中有放回选取m´个数据
D 从m个数据中无放回选取m´个数据
二、
- 类别不平衡的数据,现有数据集,一类数据占比90%,另外一类占比10%,我们可以很轻松的得到准确率为90%的模型,但是另一类数据的准确率为0,请问如何处理本题类别不平衡的问题
- 信息增益偏向于取值多的属性,解释原因,怎么做可以缓解该问题?
三、机器学习的评估方法有哪些,说出他们的优缺点
四、 某个疾病的判断,医生的错误率为10%
(1)训练集错误率8%,验证集错误率25%,用什么方案解决,为什么
(2)训练集错误率25%,验证集错误率30%,用什么方案解决,为什么
五、对于数量少的数据集,采用什么评估方法,为什么?
六、
x1(2, 2) x2(3 , 5) x3(1 , 0)
且x1 x2为正例,x3为反例 η=1
误分类点公式 -yi ( wxi + b ) >0
w<---w+η yi xi
b<---b+ηyi
求w和b的最终值
