Day25评价问题

评价问题本质是用科学指标判断模型好不好用,核心是"看模型预测结果和真实情况差多少",帮你选出效果最优的模型。

  1. 核心逻辑:先分数据,再看指标拆分数据:不能用训练模型的数据来评价(相当于考试偷看答案),要把数据分成两部分------训练集(教模型学习)和测试集(考模型效果)。

选对指标:根据任务类型挑指标,不同任务"好模型"的标准不同,比如:

  • 分类任务(如判断邮件是否为垃圾邮件):看准确率(对的占比)、召回率(漏判的少不少)。

  • 回归任务(如预测明天的气温):看MAE(平均绝对误差,误差越小越好)。

  1. 小白必避的2个坑
  • 坑1:指标只看一个。比如只看准确率,可能忽略"少数重要样本全错"的问题(如癌症检测漏诊)。

  • 坑2:测试集"污染"。如果测试集的数据提前被模型见过,评价结果会虚高,毫无参考价值。@浙大疏锦行

相关推荐
万行6 分钟前
机器人系统ROS2
人工智能·python·机器学习·机器人·计算机组成原理
阿豪只会阿巴40 分钟前
【多喝热水系列】从零开始的ROS2之旅——Day10 话题的订阅与发布1:Python
开发语言·c++·python·ubuntu·ros2
橙露1 小时前
时间序列分析实战:用 Python 实现股票价格预测与风险评估
人工智能·python·机器学习
神云瑟瑟1 小时前
看langchain理解python中的链式调用
python·langchain·链式调用
栈与堆1 小时前
LeetCode 21 - 合并两个有序链表
java·数据结构·python·算法·leetcode·链表·rust
CCPC不拿奖不改名1 小时前
循环神经网络RNN:整数索引→稠密向量(嵌入层 / Embedding)详解
人工智能·python·rnn·深度学习·神经网络·自然语言处理·embedding
鹤入云霄1 小时前
基于Python的空气质量监测系统
python
长行3 小时前
Python|Windows 安装 DeepSpeed 安装方法及报错 Unable to pre-compile async_io 处理
windows·python·deepspeed
百锦再3 小时前
python之路并不一马平川:带你踩坑Pandas
开发语言·python·pandas·pip·requests·tools·mircro
Python之栈3 小时前
5款拖拽式Python GUI生成器助你快速打造炫酷界面
python