Day25评价问题

评价问题本质是用科学指标判断模型好不好用,核心是"看模型预测结果和真实情况差多少",帮你选出效果最优的模型。

  1. 核心逻辑:先分数据,再看指标拆分数据:不能用训练模型的数据来评价(相当于考试偷看答案),要把数据分成两部分------训练集(教模型学习)和测试集(考模型效果)。

选对指标:根据任务类型挑指标,不同任务"好模型"的标准不同,比如:

  • 分类任务(如判断邮件是否为垃圾邮件):看准确率(对的占比)、召回率(漏判的少不少)。

  • 回归任务(如预测明天的气温):看MAE(平均绝对误差,误差越小越好)。

  1. 小白必避的2个坑
  • 坑1:指标只看一个。比如只看准确率,可能忽略"少数重要样本全错"的问题(如癌症检测漏诊)。

  • 坑2:测试集"污染"。如果测试集的数据提前被模型见过,评价结果会虚高,毫无参考价值。@浙大疏锦行

相关推荐
安冬的码畜日常1 天前
【玩转 Postman 接口测试与开发2_020】(完结篇)DIY 实战:随书示例 API 项目本地部署保姆级搭建教程(含完整调试过程)
python·测试工具·django·接口测试·postman·fastapi·api项目
winfredzhang1 天前
wxPython实战:打造一个优雅的图片预览工具
chrome·python·预览·剪切板
superman超哥1 天前
仓颉GC调优参数深度解析
c语言·开发语言·c++·python·仓颉
Byron Loong1 天前
【机器视觉】人物安全距离监测
python·yolo·计算机视觉
Swizard1 天前
告别“裸奔”代码:用 Pydantic 让你的 Python 数据固若金汤
python
老歌老听老掉牙1 天前
砂轮轮廓的数学建模与可视化分析
python·数学建模·sympy·砂轮
xoliu11 天前
Pytorch核心基础入门
人工智能·pytorch·python
一瞬祈望1 天前
ResNet50 图像分类完整实战(Notebook Demo + 训练代码)
人工智能·python·神经网络·数据挖掘
其美杰布-富贵-李1 天前
PyTorch Lightning Callback 指南
人工智能·pytorch·python·回调函数·callback
_codemonster1 天前
python易混淆知识点(十六)lambda表达式
开发语言·python