机器学习常见面试题总结

1、泛华误差的分解

训练模型的目的------最小化损失函数------泛化误差 可以分解为偏差(Biase)方差(Variance)噪声(Noise)。

bias:拟合值和真实值之间有较大的偏差。所有可能的训练数据集 训练出的所有模型 的输出的平均值真实模型的输出值之间的差异。

varience:反映的是拟合值波动的情况。不同的训练数据集训练出的模型输出值之间的差异。

Noise:噪声 的存在是学习算法所无法解决的问题,数据的质量决定了学习的上限。假设在数据已经给定的情况下,此时上限已定,我们要做的就是尽可能的接近这个上限。

2、偏差、方差与过拟合、欠拟合的关系?

偏差(Bias)与方差(Variance) - 知乎 (zhihu.com)

3、trade-off between bias and variance

泛华误差=偏差(Biase)+方差(Variance)+噪声(Noise)。

从本质上讲,如果你使模型更复杂并添加更多变量,你将会失去一些 Bias 但获得一些 Variance,这就是我们所说的权衡(tradeoff)。这也是为什么我们在建模的过程中,不希望这个模型同时拥有高的偏差和方差。

4、KNN对比K-means

有监督和无监督。

都是基于距离的。

相关推荐
千寻girling3 小时前
Python 是用来做 AI 人工智能 的 , 不适合开发 Web 网站 | 《Web框架》
人工智能·后端·算法
AI攻城狮3 小时前
OpenClaw 里 TAVILY_API_KEY 明明写在 ~/.bashrc,为什么还是失效?一次完整排查与修复
人工智能·云原生·aigc
stark张宇3 小时前
构建第一个AI聊天机器人:Flask+DeepSeek+Postgres实战
人工智能·postgresql·flask
yiyu07164 小时前
3分钟搞懂深度学习AI:自我进化的最简五步法
人工智能·深度学习
浪浪山_大橙子6 小时前
OpenClaw 十分钟快速,安装与接入完全指南 - 推荐使用trae 官方 skills 安装
前端·人工智能
火山引擎开发者社区6 小时前
OpenClaw 快速上手:把云手机变成你的 7×24 小时 AI 手机助手
人工智能
Qlly6 小时前
DDD 架构为什么适合 MCP Server 开发?
人工智能·后端·架构
Lee川6 小时前
从零构建智能对话系统:AI Agent 实战指南
人工智能
冬奇Lab7 小时前
一天一个开源项目(第43篇):Star-Office-UI - 像素风格的 AI 办公室看板,让 AI 助手的工作状态可视化
人工智能·开源·资讯
风象南7 小时前
纯文本模型竟然也能直接“画图”,而且还很好用
前端·人工智能·后端