机器学习笔记之监督学习

基本概念

用于训练模型的数据集称为:训练集

成本函数/代价函数:指示模型的运行情况,用于衡量训练数据与该直线的拟合程度。将预测值和目标值做差,该差值也被称为"损失值"。

例如我们需要计算平均的平方误差来衡量

成本函数/平方误差成本函数:(假设训练集中一共有m组的数据,将每个数据的预测值和真实值做差后取平方,然后求和再除以数量m,即可得到平均值。其中再多除以2是为了使数据更好看,不除以2也同样可以表示成本函数,用J(w,b)来表示)

同时由于y的预测值,也就是第一个y,本身是f(x)=wx+b的输出,也可以写成如下形式

模型:例如模型为f(x)=wx+b 那么w和b就是在训练期间需要调整来改变模型的变量,w和b也可以被称为系数/权重

监督学习

提供具体正确答案的数据来对模型进行训练,后续用这个模型来对未知的数据进行预测。

线性回归模型

概念:为给定的数据拟合一条直线。输出的结果是数字的形式,其可能有无限多种可能的数字的输出结果,相比于分类的模型。

分类模型

基于类别来进行预测,例如预测图片中是猫还是狗这种。由于种类有些,所以其输出一般都是少量的类型,如猫/狗。

相关推荐
diablobaal2 分钟前
云计算学习100天-第26天
学习·云计算
yzx99101328 分钟前
从机器视觉到图像识别:计算机视觉的多维探索
人工智能·深度学习·机器学习
是Dream呀30 分钟前
GPT-5时代的AI工具:AiOnly一站式平台深度体验报告
人工智能·深度学习·机器学习
测试老哥1 小时前
pytest+requests+allure自动化测试接入Jenkins学习
自动化测试·软件测试·学习·测试工具·职场和发展·jenkins·pytest
先做个垃圾出来………2 小时前
迁移学习(Transfer Learning)
人工智能·机器学习·迁移学习
UserNamezhangxi2 小时前
kotlin 协程笔记
java·笔记·kotlin·协程
diablobaal4 小时前
云计算学习100天-第21天
学习
wait a minutes5 小时前
【自动驾驶】8月 端到端自动驾驶算法论文(arxiv20250819)
人工智能·机器学习·自动驾驶
聚客AI6 小时前
深度拆解AI大模型从训练框架、推理优化到市场趋势与基础设施挑战
图像处理·人工智能·pytorch·深度学习·机器学习·自然语言处理·transformer
翻滚的小@强6 小时前
数据挖掘笔记:点到线段的距离计算
人工智能·笔记·数据挖掘