机器学习笔记之监督学习

基本概念

用于训练模型的数据集称为:训练集

成本函数/代价函数:指示模型的运行情况,用于衡量训练数据与该直线的拟合程度。将预测值和目标值做差,该差值也被称为"损失值"。

例如我们需要计算平均的平方误差来衡量

成本函数/平方误差成本函数:(假设训练集中一共有m组的数据,将每个数据的预测值和真实值做差后取平方,然后求和再除以数量m,即可得到平均值。其中再多除以2是为了使数据更好看,不除以2也同样可以表示成本函数,用J(w,b)来表示)

同时由于y的预测值,也就是第一个y,本身是f(x)=wx+b的输出,也可以写成如下形式

模型:例如模型为f(x)=wx+b 那么w和b就是在训练期间需要调整来改变模型的变量,w和b也可以被称为系数/权重

监督学习

提供具体正确答案的数据来对模型进行训练,后续用这个模型来对未知的数据进行预测。

线性回归模型

概念:为给定的数据拟合一条直线。输出的结果是数字的形式,其可能有无限多种可能的数字的输出结果,相比于分类的模型。

分类模型

基于类别来进行预测,例如预测图片中是猫还是狗这种。由于种类有些,所以其输出一般都是少量的类型,如猫/狗。

相关推荐
Starry_hello world32 分钟前
Linux 的准备工作
linux·笔记·有问必答
viperrrrrrrrrr73 小时前
大数据学习(105)-Hbase
大数据·学习·hbase
IT _oA3 小时前
Active Directory 域服务
运维·服务器·网络·windows·笔记
袖清暮雨3 小时前
Python刷题笔记
笔记·python·算法
六bring个六4 小时前
QT上位机笔记
开发语言·笔记·qt
熬夜造bug4 小时前
LeetCode Hot100 刷题笔记(1)—— 哈希、双指针、滑动窗口
笔记·leetcode·hot100
乌旭4 小时前
AI芯片混战:GPU vs TPU vs NPU的算力与能效博弈
人工智能·pytorch·python·深度学习·机器学习·ai·ai编程
行思理5 小时前
go语言应该如何学习
开发语言·学习·golang
oceanweave6 小时前
【k8s学习之CSI】理解 LVM 存储概念和相关操作
学习·容器·kubernetes
花之亡灵7 小时前
.net6 中实现邮件发送
笔记·c#·.net·代码规范