概述:监督学习(分类,回归)与无监督学习(聚类)

目录:

一、监督学习:

1.什么是监督学习:

  • 当前创造市场价值的机器学习中99%都是监督学习。
  • 监督学习是指学习从input到output映射的算法 ,监督学习的关键是开发者提供供模型训练示例
  • 在训练阶段开发者需给定输入input和正确的输出output供模型训练,模型从输入、输出对中学习之后,在预测阶段模型只需接收输入未知input就会给出合理的预测值output。

2.监督学习类型:

  1. 分类 Classification 有限种预测结果
  2. 回归 Regression 无限种预测结果
  • 区别:分类问题预测输出的是有限集合(输入肿瘤数据预测A、B、C类[有限类型]肿瘤);回归问题预测输出的是无限集合(输入负荷数据预测用电量值[∈R])。

二、无监督学习

1.什么是无监督学习:

  • 无监督学习是指开发者仅提供input输入,而不给定output真实值标签,由模型自主学习input中的数据集,给出数据中可能存在的模式或结构。
  • 例如:监督学习给出input:肿瘤大小、患者年龄,output:肿瘤类型,模型学习Input和output后再对未知的input预测其output。而无监督学习给出input:肿瘤大小、患者年龄,不提供output,模型仅学习input来获取数据中的一些模式(模型学习后可能会将数据分为好几组)。
  • 再例如:在监督学习时候,我可能会对模型说:"我现在给你历史病人的肿瘤数据input和这些肿瘤分别是什么类型的真实output,你需要学习他们,以便于你能帮我预测今天刚来检查肿瘤的病人,即给你他们的肿瘤数据你能帮我预测今天的病人肿瘤的类型";在非监督学习的时候,我可能会说:"我现在给你历史病人的肿瘤数据input,这些数据太多太杂乱了,你能学习一下然后找到这些历史肿瘤数据中的相关性并将他们归类吗"。
  • 监督学习需提供input和output,非监督学习仅提供input。监督学习和无监督学习的区别就在于是否提供output真实值标签供模型学习,是否带有对未知数据的预测性质。

2.无监督学习类型:

  1. 聚类 Clustering:模型根据开发者提供的input(而不提供标签)根据数据的相似度将数据分成多个组,例如谷歌通过聚类算法可以将每天的上万条新闻按照词条和相关度归类显示。(这里注意区分与监督学习中的分类问题区别,即有无标签,是否带有对未知数据的预测性质)
  2. 异常检测 Anomaly detection
  3. 降维 Dimensionality reduction
  • 区别:聚类问题
相关推荐
zhangfeng11331 小时前
Warmup Scheduler深度学习训练中,在训练初期使用较低学习率进行预热(Warmup),然后再按照预定策略(如余弦退火、阶梯下降等)衰减学习率的方法
人工智能·深度学习·学习
red_redemption3 小时前
自由学习记录(118)
学习
小猪佩奇TONY3 小时前
OpenCL 学习(5)---- OpenCL 内核和内核参数
学习
01二进制代码漫游日记4 小时前
自定义类型:联合和枚举(一)
c语言·开发语言·学习·算法
非凡ghost4 小时前
小X分身APP(手机分身类工具)
android·windows·学习·智能手机·软件需求
weixin_458872614 小时前
东华复试OJ每日3题打卡·复盘82~84
学习
昌兵鼠鼠5 小时前
LeetCode Hot100 哈希
学习·算法·leetcode·哈希算法
人工智能AI酱5 小时前
【AI深究】高斯混合模型(GMM)全网最详细全流程详解与案例(附Python代码演示) | 混合模型概率密度函数、多元高斯分布概率密度函数、期望最大化(EM)算法 | 实际案例与流程 | 优、缺点分析
人工智能·python·算法·机器学习·分类·回归·聚类
旖旎夜光5 小时前
哈希(14)(下)
数据结构·c++·学习
2401_848009727 小时前
Redis零基础入门学习
数据库·redis·学习