机器学习-过拟合&欠拟合问题

欠拟合

还是回到线性回归欠拟合的例子,如下图,我们得到的模型是房屋的大小和模型,可以看到随着房屋面积的表达,模型并没有,所以模型并没有很好的拟合训练数据,这个技术数据就是欠拟合另一个数据就是算法具有高偏差,

欠拟合意味着算法无法很好的拟合训练集,训练数据中有一个明显的模式,但是算法无法捕捉到

在上图中,第二个数据集合的刚刚好,泛化能力也不错,如果说在训和练测试的数据集之外的其他数据集中,模型拟合这些数据的能力也不错,这叫做泛化,我们说希望你的学习算法可以更好的泛化,这意味着,即使在他从未见过的数据集上也能做错良好的预测,对新样本有很好的泛化能力。

看一下上图同的第三个图,这条曲线非常完美的拟合了训练数据,因为他恰好通过了所有的训练数据,可以通过选择参数,使得这个模型的代价函数刚好等于使他这五个样本中的误差刚好等于0,

这是一条非常曲折的曲线,在各处上下波动,在某些地方,房子相比面积很小,但是房价更贵,所以可以认为这不是一个很好的房价预测模型。技术术语会说这个模型过拟合了这些数据,或者说模型存在过拟合问题,虽然他拟合了所有的数据,但是拟合的太好了,属于死记硬背,看起来也不具备非常好的泛化能力,另一个属于就是算法具有高方差,

中间的是模型刚刚好,他既不过拟合,也不欠拟合,几部高偏差,也不高方差,目前为止还没有也定的术语,我们也可以看到,机器学习就是在寻找一个既不过拟合也不欠拟合的模型,

如上图我们可以看到,第一个数据拟合的不太好,属于欠拟合,第二个,数据拟合的刚刚好,第三个数据是过拟合也叫高方不一定有很好的泛化能力

相关推荐
北京耐用通信1 分钟前
全域适配工业场景耐达讯自动化Modbus TCP 转 PROFIBUS 网关轻松实现以太网与现场总线互通
网络·人工智能·网络协议·自动化·信息与通信
火山引擎开发者社区4 分钟前
TRAE × 火山引擎 Supabase:为你的 AI 应用装上“数据引擎”
人工智能
小a彤32 分钟前
GE 在 CANN 五层架构中的位置
人工智能·深度学习·transformer
前端若水1 小时前
会话管理:创建、切换、删除对话历史
前端·人工智能·python·react.js
Upsy-Daisy1 小时前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习
企学宝1 小时前
企学宝5月专题课程丨《OpenClaw AI 智能体实战营:从零基础部署到全场景自动化落地》
人工智能·ai·企业培训
冬奇Lab2 小时前
让 AI Agent 更可靠:Harness Engineering 与多 Agent 系统工程实践
人工智能·llm·agent
放下华子我只抽RuiKe52 小时前
React 从入门到生产(四):自定义 Hook
前端·javascript·人工智能·深度学习·react.js·自然语言处理·前端框架
想你依然心痛2 小时前
HarmonyOS 6(API 23)实战:基于悬浮导航、沉浸光感与HMAF的“文思智脑“——PC端AI智能体沉浸式智能写作工作台
人工智能·ar·harmonyos·ai写作
冬奇Lab2 小时前
一天一个开源项目(第108篇):Andrej Karpathy Skills - 用一个 CLAUDE.md 文件修复 LLM 编码的四个顽疾
人工智能·开源·资讯