机器学习常见面试题总结

1、泛华误差的分解

训练模型的目的------最小化损失函数------泛化误差 可以分解为偏差(Biase)方差(Variance)噪声(Noise)。

bias:拟合值和真实值之间有较大的偏差。所有可能的训练数据集 训练出的所有模型 的输出的平均值真实模型的输出值之间的差异。

varience:反映的是拟合值波动的情况。不同的训练数据集训练出的模型输出值之间的差异。

Noise:噪声 的存在是学习算法所无法解决的问题,数据的质量决定了学习的上限。假设在数据已经给定的情况下,此时上限已定,我们要做的就是尽可能的接近这个上限。

2、偏差、方差与过拟合、欠拟合的关系?

偏差(Bias)与方差(Variance) - 知乎 (zhihu.com)

3、trade-off between bias and variance

泛华误差=偏差(Biase)+方差(Variance)+噪声(Noise)。

从本质上讲,如果你使模型更复杂并添加更多变量,你将会失去一些 Bias 但获得一些 Variance,这就是我们所说的权衡(tradeoff)。这也是为什么我们在建模的过程中,不希望这个模型同时拥有高的偏差和方差。

4、KNN对比K-means

有监督和无监督。

都是基于距离的。

相关推荐
妄想成为master3 分钟前
计算机视觉----基于锚点的车道线检测、从Line-CNN到CLRNet到CLRKDNet 本文所提算法Line-CNN 后续会更新以下全部算法
人工智能·计算机视觉·车道线检测
夜幕龙12 分钟前
LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署
人工智能·深度学习·机器学习
未来之窗软件服务36 分钟前
人体肢体渲染-一步几个脚印从头设计数字生命——仙盟创梦IDE
开发语言·ide·人工智能·python·pygame·仙盟创梦ide
戌崂石43 分钟前
最优化方法Python计算:有约束优化应用——线性不可分问题支持向量机
python·机器学习·支持向量机·最优化方法
Echo``44 分钟前
40:相机与镜头选型
开发语言·人工智能·深度学习·计算机视觉·视觉检测
Christo31 小时前
关于在深度聚类中Representation Collapse现象
人工智能·深度学习·算法·机器学习·数据挖掘·embedding·聚类
Apache RocketMQ1 小时前
Apache RocketMQ ACL 2.0 全新升级
人工智能
QX_hao1 小时前
【project】--数据挖掘
人工智能·数据挖掘
showmethetime1 小时前
matlab提取脑电数据的五种频域特征指标数值
前端·人工智能·matlab
依然易冷1 小时前
Manus AI 原理深度解析第三篇:Tools
人工智能·深度学习·机器学习