机器学习笔记之监督学习

基本概念

用于训练模型的数据集称为:训练集

成本函数/代价函数:指示模型的运行情况,用于衡量训练数据与该直线的拟合程度。将预测值和目标值做差,该差值也被称为"损失值"。

例如我们需要计算平均的平方误差来衡量

成本函数/平方误差成本函数:(假设训练集中一共有m组的数据,将每个数据的预测值和真实值做差后取平方,然后求和再除以数量m,即可得到平均值。其中再多除以2是为了使数据更好看,不除以2也同样可以表示成本函数,用J(w,b)来表示)

同时由于y的预测值,也就是第一个y,本身是f(x)=wx+b的输出,也可以写成如下形式

模型:例如模型为f(x)=wx+b 那么w和b就是在训练期间需要调整来改变模型的变量,w和b也可以被称为系数/权重

监督学习

提供具体正确答案的数据来对模型进行训练,后续用这个模型来对未知的数据进行预测。

线性回归模型

概念:为给定的数据拟合一条直线。输出的结果是数字的形式,其可能有无限多种可能的数字的输出结果,相比于分类的模型。

分类模型

基于类别来进行预测,例如预测图片中是猫还是狗这种。由于种类有些,所以其输出一般都是少量的类型,如猫/狗。

相关推荐
Magnetic_h14 分钟前
【iOS】block复习
笔记·macos·ios·objective-c·cocoa
带娃的IT创业者39 分钟前
《AI大模型应知应会100篇》第68篇:移动应用中的大模型功能开发 —— 用 React Native 打造你的语音笔记摘要 App
人工智能·笔记·react native
东风西巷41 分钟前
Atlantis Word Processor:全方位的文字处理专家
前端·学习·word·软件需求
Godspeed Zhao1 小时前
自动驾驶中的传感器技术42——Radar(3)
人工智能·机器学习·自动驾驶
Godspeed Zhao1 小时前
自动驾驶中的传感器技术41——Radar(2)
人工智能·机器学习·自动驾驶
非门由也2 小时前
《sklearn机器学习——数据预处理》类别特征编码
人工智能·机器学习·sklearn
焦耳加热7 小时前
阿德莱德大学Nat. Commun.:盐模板策略实现废弃塑料到单原子催化剂的高值转化,推动环境与能源催化应用
人工智能·算法·机器学习·能源·材料工程
wan5555cn8 小时前
多张图片生成视频模型技术深度解析
人工智能·笔记·深度学习·算法·音视频
Broken Arrows8 小时前
Linux学习——管理网络安全(二十一)
linux·学习·web安全