基本概念
用于训练模型的数据集称为:训练集
成本函数/代价函数:指示模型的运行情况,用于衡量训练数据与该直线的拟合程度。将预测值和目标值做差,该差值也被称为"损失值"。
例如我们需要计算平均的平方误差来衡量
成本函数/平方误差成本函数:(假设训练集中一共有m组的数据,将每个数据的预测值和真实值做差后取平方,然后求和再除以数量m,即可得到平均值。其中再多除以2是为了使数据更好看,不除以2也同样可以表示成本函数,用J(w,b)来表示)
同时由于y的预测值,也就是第一个y,本身是f(x)=wx+b的输出,也可以写成如下形式
模型:例如模型为f(x)=wx+b 那么w和b就是在训练期间需要调整来改变模型的变量,w和b也可以被称为系数/权重
监督学习
提供具体正确答案的数据来对模型进行训练,后续用这个模型来对未知的数据进行预测。
线性回归模型
概念:为给定的数据拟合一条直线。输出的结果是数字的形式,其可能有无限多种可能的数字的输出结果,相比于分类的模型。
分类模型
基于类别来进行预测,例如预测图片中是猫还是狗这种。由于种类有些,所以其输出一般都是少量的类型,如猫/狗。