机器学习基础概念(3)

小小考一下大家前两节的内容(坏笑)

我们如何评判一个机器学习模型的性能呢? 通常是判断它的泛化能力(对于未知数据的处理能力)

那么对于泛化能力是否有一个标准,比如在未知的1万个数据中,泛化能力 模型一90% > 模型二80% , 我们能说模型一就比模型二好吗? 根据NFL原则(没有绝对最好的),我们可以知道,刚刚那句话是不对的,比如对A来说,他需要前100个好就行,其他不重要,但B需要前10000个好,我们需要对他们进行定制不同的模型。

进入正题,我们手中没有没见过的数据(unseen instance),所以我们只能用已知的数据来调试模型参数,训练模型模型并模拟未知的数据来测试模型性能

调试模型就是用验证集来调试参数(这个在这篇文章的后面讲)。

训练模型就是用训练集。

测试模型就是用测试集。

这个时候就会出现两个事情:过拟合和欠拟合。

过拟合:模型对于训练数据的特征进行过度解析,导致出现不符合该问题一般特征的判断。

欠拟合:模型对于训练数据的特征解析不够,导致没有全面了解该问题一般特征,无法做出正确判断。

下图可以很好地表现

上面是直观表示,两条线,一个是真实训练效果,这个是我们训练出来出来对于未来数据的效果,实际上是先欠拟合,之后越来越好,再之后过拟合。表面训练效果就是对于训练集表现出来的表面效果,是看起来越来越好的,但是实际后面已经出现过拟合了。

之后我们需要探讨一下模型选择方面的事,有三个问题

评估方法--如何获得评测结果,获得什么样的评测结果

性能度量--如何评估性能优劣,怎么判断需要什么性能

比较检验--如何判断实质差别,用什么标准比较模型的差别

OK,这节就这样

相关推荐
攻城狮7号9 小时前
京东AI数字人直播服务对商家免费开放:一场“免费午餐”的背后
人工智能·电商·ai数字人·京东直播服务
炫饭第一名9 小时前
前端玩转 AI 应用开发|SSE 协议与JS中的流式处理🌊
前端·人工智能·程序员
leo_2329 小时前
AI私教--SMP(软件制作平台)开发的第一个产品(小视频)
人工智能·smp(软件制作平台)·软件开发工具·应用系统
T___T9 小时前
通过 MCP 让 AI 读懂你的 Figma 设计稿
前端·人工智能
悟纤9 小时前
Suno 创作Rap音乐李白的《将进酒》,音乐风格音乐无所不能 | 从零开始用Suno Ai | 第5篇
人工智能·suno ai·suno api·ai music
小小工匠9 小时前
LLM - Google 5-Day AI Agents Intensive
人工智能·ai agents
雨大王51210 小时前
AI视觉检测怎么选?技术原理、行业应用与解决方案解析
人工智能·计算机视觉·视觉检测
ziwu10 小时前
【垃圾识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法
人工智能·深度学习·图像识别
Elastic 中国社区官方博客10 小时前
Elasticsearch:数据脱节如何破坏现代调查
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
却道天凉_好个秋10 小时前
OpenCV(三十八):什么是特征检测
人工智能·opencv·计算机视觉