人工智能之机器学习2-有监督学习【培训机构学习笔记】

监督学习【有标签】

1、分类(Classification)

  • 预测的标签是离散值
  • 如根据年龄、性别、学历判断这个人的收入水平

2、回归(Regression、Prediction)

  • 预测的标签是连续值
  • 例如,预测房价时,房价可以是任意的非负实数,它就是一个连续的标签;又如预测股票价格、温度变化、时间序列数据中的下一个值等,这些问题中的标签都是连续的

3、储存方式

特征向量

  • 输入实例x为特征向量:
  • 多个特征向量组成特征矩阵,其中每一行是一组特征数据,如房屋面积、几室几厅,每平米多少钱等,每一列为一个属性数据,如全部都是房屋面积或全部都是单价。
  • 的上标表示第i个样本的x向量,若为下标,则表示第i维度的值,即第几组特征数据。如则表示为第一组特征数据中的第2个特征样本数据。
  • 培训机构的课程质量堪忧,作为零基础小白,实在被绕晕,而且都没讲清楚的情况下,直接跳过不讲了,如下图:

标签

  • y为标签(label),目标属性,标量

特征向量与标签的关系

  • **输入:**特征属性X
  • **输出:**目标值Y
  • 获得一个目标函数(target function):f: X----> Y(理想公式)
  • 输入数据:D={(x1,y1),(x2,y2),....,(xn,yn)}(历史记录信息)
  • 最终获得具有最优性能的假设公式:g:X---->Y(学习得到的最终公式)
  • 拟合:判断 构建的算法模型是否符合给定数据的特征
  • **过拟合:**算法太符合样本数据的特征,对于实际生产却无法拟合
  • **欠拟合:**算法连样本的特征数据都不符合
相关推荐
java_heartLake7 分钟前
基于deepseek的AI知识库系统搭建
人工智能·deepseek
阿里云云原生1 小时前
山石网科×阿里云通义灵码,开启研发“AI智造”新时代
网络·人工智能·阿里云·ai程序员·ai程序员体验官
diemeng11192 小时前
AI前端开发技能变革时代:效率与创新的新范式
前端·人工智能
有Li2 小时前
跨中心模型自适应牙齿分割|文献速递-医学影像人工智能进展
人工智能
StickToForever3 小时前
第4章 信息系统架构(五)
经验分享·笔记·学习·职场和发展
万事可爱^6 小时前
HDBSCAN:密度自适应的层次聚类算法解析与实践
算法·机器学习·数据挖掘·聚类·hdbscan
leegong231116 小时前
学习PostgreSQL专家认证
数据库·学习·postgresql
牧歌悠悠7 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬7 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬7 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构