机器学习笔记之监督学习

基本概念

用于训练模型的数据集称为:训练集

成本函数/代价函数:指示模型的运行情况,用于衡量训练数据与该直线的拟合程度。将预测值和目标值做差,该差值也被称为"损失值"。

例如我们需要计算平均的平方误差来衡量

成本函数/平方误差成本函数:(假设训练集中一共有m组的数据,将每个数据的预测值和真实值做差后取平方,然后求和再除以数量m,即可得到平均值。其中再多除以2是为了使数据更好看,不除以2也同样可以表示成本函数,用J(w,b)来表示)

同时由于y的预测值,也就是第一个y,本身是f(x)=wx+b的输出,也可以写成如下形式

模型:例如模型为f(x)=wx+b 那么w和b就是在训练期间需要调整来改变模型的变量,w和b也可以被称为系数/权重

监督学习

提供具体正确答案的数据来对模型进行训练,后续用这个模型来对未知的数据进行预测。

线性回归模型

概念:为给定的数据拟合一条直线。输出的结果是数字的形式,其可能有无限多种可能的数字的输出结果,相比于分类的模型。

分类模型

基于类别来进行预测,例如预测图片中是猫还是狗这种。由于种类有些,所以其输出一般都是少量的类型,如猫/狗。

相关推荐
今儿敲了吗4 分钟前
C++概述
c++·笔记
jiayong235 分钟前
model.onnx 深度分析报告(第2篇)
人工智能·机器学习·向量数据库·向量模型
Qhumaing25 分钟前
C++学习:【PTA】数据结构 7-2 实验6-2(图-邻接表)
数据结构·c++·学习
知行力33 分钟前
【GitHub每日速递 20260108】告别云服务弊端,Memos隐私至上自托管笔记服务来袭!
笔记·github
好奇龙猫35 分钟前
【日语学习-日语知识点小记-日本語体系構造-JLPT-N2前期阶段-第一阶段(1):再次起航】
学习
张祥64228890438 分钟前
数理统计基础一
人工智能·机器学习·概率论
wdfk_prog39 分钟前
[Linux]学习笔记系列 -- [fs]sysfs
linux·笔记·学习
悟乙己40 分钟前
使用TimeGPT进行时间序列预测案例解析
机器学习·大模型·llm·时间序列·预测
云和数据.ChenGuang1 小时前
人工智能实践之基于CNN的街区餐饮图片识别案例实践
人工智能·深度学习·神经网络·机器学习·cnn
菜的不敢吱声1 小时前
swift学习第5天
学习·ssh·swift