机器学习常见面试题总结

1、泛华误差的分解

训练模型的目的------最小化损失函数------泛化误差 可以分解为偏差(Biase)方差(Variance)噪声(Noise)。

bias:拟合值和真实值之间有较大的偏差。所有可能的训练数据集 训练出的所有模型 的输出的平均值真实模型的输出值之间的差异。

varience:反映的是拟合值波动的情况。不同的训练数据集训练出的模型输出值之间的差异。

Noise:噪声 的存在是学习算法所无法解决的问题,数据的质量决定了学习的上限。假设在数据已经给定的情况下,此时上限已定,我们要做的就是尽可能的接近这个上限。

2、偏差、方差与过拟合、欠拟合的关系?

偏差(Bias)与方差(Variance) - 知乎 (zhihu.com)

3、trade-off between bias and variance

泛华误差=偏差(Biase)+方差(Variance)+噪声(Noise)。

从本质上讲,如果你使模型更复杂并添加更多变量,你将会失去一些 Bias 但获得一些 Variance,这就是我们所说的权衡(tradeoff)。这也是为什么我们在建模的过程中,不希望这个模型同时拥有高的偏差和方差。

4、KNN对比K-means

有监督和无监督。

都是基于距离的。

相关推荐
松岛雾奈.23019 小时前
机器学习--KNN算法中的距离、范数、正则化
人工智能·算法·机器学习
程途拾光15820 小时前
用流程图优化工作流:快速识别冗余环节,提升效率
大数据·论文阅读·人工智能·流程图·论文笔记
Lab4AI大模型实验室20 小时前
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
人工智能·github·deepseek-ocr
Brduino脑机接口技术答疑20 小时前
支持向量机(SVM)在脑电情绪识别中的学术解析与研究进展
人工智能·算法·机器学习·支持向量机·数据分析
北京耐用通信20 小时前
从‘卡壳’到‘丝滑’:耐达讯自动化PROFIBUS光纤模块如何让RFID读写器实现‘零延迟’物流追踪?”
网络·人工智能·科技·物联网·网络协议·自动化
xier_ran20 小时前
深度学习:Mini-batch 大小选择与 SGD 和 GD
人工智能·算法·机器学习
CodeLiving20 小时前
MCP学习三——MCP相关概念
人工智能·mcp
Gitpchy20 小时前
简单CNN——作业(补充)
人工智能·神经网络·cnn
齐齐大魔王20 小时前
深度学习系列(二)
人工智能·深度学习
xier_ran20 小时前
深度学习:学习率衰减(Learning Rate Decay)
人工智能·深度学习·机器学习