第一章_机器学习概述_06.机器学习_模拟拟合问题

一、拟合

1、拟合:用在机器学习领域,用来表示模型对样本点的拟合情况。

2、欠拟合:模型在训练集上表现很差、在测试集表现也很差。

3、过拟合:模型在训练集上表现很好、在测试集表现很差。

二、模型表现效果 -- 欠拟合欠拟合 -- 从样本分布角度看

欠拟合产生的原因:模型过于简单。

过拟合产的原因:模型太过于复杂、数据不纯、训练数据太少。

泛化 Generalization :模型在新数据集(非训练数据)上的表现好坏的能力。

奥卡姆剃刀原则:给定两个具有相同泛化误差的模型,较简单的模型比较复杂的模型更可取。(相同效果下选取成本较小的)

相关推荐
Ricky05535 小时前
CTRL-WORLD:一种用于机器人操控的可控生成世界模型(中美2025年联合研究)
人工智能·机器人·世界模型
jeffer_liu5 小时前
Spring AI 生产级实战:工具调用
java·人工智能·后端·spring·ai编程
阿乔外贸日记5 小时前
2026尼日利亚五项清关政策更新,拉高能源装备进口综合成本
大数据·人工智能·搜索引擎·智能手机·云计算·能源
民乐团扒谱机5 小时前
【AI笔记】短时纯音时长对音高感知偏移效应研究综述
人工智能·笔记
侃谈科技圈6 小时前
破除数据中台落地困境:2026数据治理平台差异化能力与选型决策指南
大数据·人工智能
大象说6 小时前
Python多进程共享队列无报错僵死 120G Nginx访问日志清洗踩坑全记录
人工智能·自然语言处理
Cosolar6 小时前
AutoGen 精通教程:从零到企业级多 Agent 系统架构师
人工智能·后端·面试
甲维斯6 小时前
Claude Code 省钱小妙招!200K和自动压缩
人工智能
DO_Community6 小时前
DigitalOcean 的 AI 推理路由器是如何构建的
人工智能·开源·agent·claude·deepseek
Elastic 中国社区官方博客6 小时前
Elasticsearch DiskBBQ:使用原生 SIMD Blocks 实现快 40% 的向量评分计算
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·diskbbq