机器学习常见面试题总结

1、泛华误差的分解

训练模型的目的------最小化损失函数------泛化误差 可以分解为偏差(Biase)方差(Variance)噪声(Noise)。

bias:拟合值和真实值之间有较大的偏差。所有可能的训练数据集 训练出的所有模型 的输出的平均值真实模型的输出值之间的差异。

varience:反映的是拟合值波动的情况。不同的训练数据集训练出的模型输出值之间的差异。

Noise:噪声 的存在是学习算法所无法解决的问题,数据的质量决定了学习的上限。假设在数据已经给定的情况下,此时上限已定,我们要做的就是尽可能的接近这个上限。

2、偏差、方差与过拟合、欠拟合的关系?

偏差(Bias)与方差(Variance) - 知乎 (zhihu.com)

3、trade-off between bias and variance

泛华误差=偏差(Biase)+方差(Variance)+噪声(Noise)。

从本质上讲,如果你使模型更复杂并添加更多变量,你将会失去一些 Bias 但获得一些 Variance,这就是我们所说的权衡(tradeoff)。这也是为什么我们在建模的过程中,不希望这个模型同时拥有高的偏差和方差。

4、KNN对比K-means

有监督和无监督。

都是基于距离的。

相关推荐
Eloudy4 分钟前
用 Python 直写 CUDA Kernel的技术,CuTile、TileLang、Triton 与 PyTorch 的深度融合实践
人工智能·pytorch
神的泪水5 分钟前
CANN 实战全景篇:从零构建 LLM 推理引擎(基于 CANN 原生栈)
人工智能
yuanyuan2o26 分钟前
【深度学习】全连接、卷积神经网络
人工智能·深度学习·cnn
八零后琐话11 分钟前
干货:Claude最新大招Cowork避坑!
人工智能
汗流浃背了吧,老弟!29 分钟前
BPE 词表构建与编解码(英雄联盟-托儿索语料)
人工智能·深度学习
软件聚导航38 分钟前
从 AI 画马到马年红包封面,我还做了一个小程序
人工智能·chatgpt
啊森要自信1 小时前
CANN ops-cv:AI 硬件端视觉算法推理训练的算子性能调优与实战应用详解
人工智能·算法·cann
要加油哦~1 小时前
AI | 实践教程 - ScreenCoder | 多agents前端代码生成
前端·javascript·人工智能
玄同7651 小时前
从 0 到 1:用 Python 开发 MCP 工具,让 AI 智能体拥有 “超能力”
开发语言·人工智能·python·agent·ai编程·mcp·trae
新缸中之脑1 小时前
用RedisVL构建长期记忆
人工智能