概述:监督学习(分类,回归)与无监督学习(聚类)

目录:

一、监督学习:

1.什么是监督学习:

  • 当前创造市场价值的机器学习中99%都是监督学习。
  • 监督学习是指学习从input到output映射的算法 ,监督学习的关键是开发者提供供模型训练示例
  • 在训练阶段开发者需给定输入input和正确的输出output供模型训练,模型从输入、输出对中学习之后,在预测阶段模型只需接收输入未知input就会给出合理的预测值output。

2.监督学习类型:

  1. 分类 Classification 有限种预测结果
  2. 回归 Regression 无限种预测结果
  • 区别:分类问题预测输出的是有限集合(输入肿瘤数据预测A、B、C类[有限类型]肿瘤);回归问题预测输出的是无限集合(输入负荷数据预测用电量值[∈R])。

二、无监督学习

1.什么是无监督学习:

  • 无监督学习是指开发者仅提供input输入,而不给定output真实值标签,由模型自主学习input中的数据集,给出数据中可能存在的模式或结构。
  • 例如:监督学习给出input:肿瘤大小、患者年龄,output:肿瘤类型,模型学习Input和output后再对未知的input预测其output。而无监督学习给出input:肿瘤大小、患者年龄,不提供output,模型仅学习input来获取数据中的一些模式(模型学习后可能会将数据分为好几组)。
  • 再例如:在监督学习时候,我可能会对模型说:"我现在给你历史病人的肿瘤数据input和这些肿瘤分别是什么类型的真实output,你需要学习他们,以便于你能帮我预测今天刚来检查肿瘤的病人,即给你他们的肿瘤数据你能帮我预测今天的病人肿瘤的类型";在非监督学习的时候,我可能会说:"我现在给你历史病人的肿瘤数据input,这些数据太多太杂乱了,你能学习一下然后找到这些历史肿瘤数据中的相关性并将他们归类吗"。
  • 监督学习需提供input和output,非监督学习仅提供input。监督学习和无监督学习的区别就在于是否提供output真实值标签供模型学习,是否带有对未知数据的预测性质。

2.无监督学习类型:

  1. 聚类 Clustering:模型根据开发者提供的input(而不提供标签)根据数据的相似度将数据分成多个组,例如谷歌通过聚类算法可以将每天的上万条新闻按照词条和相关度归类显示。(这里注意区分与监督学习中的分类问题区别,即有无标签,是否带有对未知数据的预测性质)
  2. 异常检测 Anomaly detection
  3. 降维 Dimensionality reduction
  • 区别:聚类问题
相关推荐
西岸行者11 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意11 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码11 天前
嵌入式学习路线
学习
毛小茛11 天前
计算机系统概论——校验码
学习
babe小鑫11 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms11 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下11 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。11 天前
2026.2.25监控学习
学习
im_AMBER11 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode
CodeJourney_J11 天前
从“Hello World“ 开始 C++
c语言·c++·学习