机器学习系列-2 线性回归&训练损失

机器学习系列-2 线性回归&训练损失

学习内容来自:谷歌ai学习
https://developers.google.cn/machine-learning/crash-course/framing/check-your-understanding?hl=zh-cn
本文作为学习记录

1 线性回归:

举例:蝉(昆虫物种)在天气炎热的日子里会比在更冷的日子里鸣叫。数十年来,专业和业余科学家一直在编制每分钟的鸣叫声和温度方面的数据。

该图表显示了温度随着鸣叫声次数的增加而上升。 鸣叫声与温度之间的关系是线性关系吗?可以,您可以绘制一条直线来大致说明这种关系:

虽然这个直线并未穿过每一个点,但清晰地显示了鸣叫声和温度之间的关系。使用直线的等式,您可以写出这种关系,如下所示:

按照机器学习的惯例,您为模型算式的过程会略有不同:
y = mx + b
y' = b + w 1 w_{1} w1 x 1 x_{1} x1

其中b为 bias,w为weight

2 训练和损失

训练模型只需从有标签样本中学习(确定)所有权重和偏差的理想值。 在监督式学习中,机器学习算法通过检查许多示例并尝试找到将损失降至最低的模型来构建模型;此过程称为经验风险最小化。

损失是错误预测的惩罚。也就是说,损失是一个表示模型在单个样本上的预测质量的数字。如果模型的预测完全准确,则损失为零,否则损失会更大。训练模型的目的是从所有样本中找到一组平均损失"较小"的权重和偏差。例如,图 3 左侧显示的是高损失模型,右侧显示的是低损失模型。对于该图,请注意以下几点:

  • 箭头表示损失。
  • 蓝线表示预测。
    图 3. 左侧模型中的损失较高;右侧模型中的损失较低。

2.1 通过创建数学函数(损失函数),以有意义的方式汇总各个损失。

平方损失函数:一种常用的损失函数

我们在此探讨的线性回归模型使用一种称为

|-------------------|
| 平方损失函数(也称为L2 损失 ) |

的损失函数。单个样本的平方损失如下:

 = the square of the difference between the label and the prediction
 =(标签和预测之间的差值的平方)
 = (observation - prediction(x))2
 = (y - y')2

均方误差 (MSE) 是指整个数据集中每个样本的平均平方损失。

如需计算 MSE,请先计算各个样本的所有平方损失之和,然后除以样本数量:

虽然 MSE 常用于机器学习,但它既不是唯一实用的损失函数,也不是适用于所有情况的最佳损失函数。

3.均方误差 (MSE) 的使用举例

均方误差 (MSE) 怎么计算和使用?

计算:

线上的 6 个示例发生的总损失为 0。四个不在线的样本并未远离离线,因此,即便使它们的平方变平方仍会产生较低的值:

相关推荐
infominer21 分钟前
RAGFlow 0.12 版本功能导读
人工智能·开源·aigc·ai-native
涩即是Null23 分钟前
如何构建LSTM神经网络模型
人工智能·rnn·深度学习·神经网络·lstm
本本的小橙子26 分钟前
第十四周:机器学习
人工智能·机器学习
励志成为美貌才华为一体的女子41 分钟前
《大规模语言模型从理论到实践》第一轮学习--第四章分布式训练
人工智能·分布式·语言模型
学步_技术1 小时前
自动驾驶系列—自动驾驶背后的数据通道:通信总线技术详解与应用场景分析
人工智能·机器学习·自动驾驶·通信总线
winds~1 小时前
自动驾驶-问题笔记-待解决
人工智能·笔记·自动驾驶
学步_技术1 小时前
自动驾驶系列—LDW(车道偏离预警):智能驾驶的安全守护者
人工智能·安全·自动驾驶·ldw
青云交1 小时前
大数据新视界 --大数据大厂之 Kafka 性能优化的进阶之道:应对海量数据的高效传输
大数据·数据库·人工智能·性能优化·kafka·数据压缩·分区策略·磁盘 i/o
SEU-WYL1 小时前
基于深度学习的视频摘要生成
人工智能·深度学习·音视频
人工智能技术咨询.2 小时前
张雪峰谈人工智能技术应用专业的就业前景!
人工智能·学习·计算机视觉·语言模型