【非监督学习常见算法】

非监督学习:当数据没有答案时

1. K-means:天生会分组的"整理师"

一句话理解:把相似的东西自动放一起

  • 就像:去超市,自动把蔬菜、水果、零食分到不同区域
  • 怎么做:先随便定几个"小组长",让每个数据找最近的组长,然后调整组长位置,重复到稳定
  • 关键:你得先告诉它要分几组

2. PCA:化繁为简的"抓重点高手"

一句话理解:从100个细节里找出最重要的3个

  • 就像:用"性价比"一个词代替"价格便宜+质量好+服务佳"
  • 怎么做:发现哪些特征总是一起变化,合并成新特征
  • 用途:让复杂数据变简单,还能画图展示

3. 聚类:发现隐藏朋友圈的"社交观察家"

一句话理解:K-means的大哥,有更多分组方法

  • 还能这样分
    • 按密度分:像找人群密集处(商场、地铁站)
    • 按层次分:像家谱(爷爷→爸爸→儿子)
  • 核心思想:让数据自己"物以类聚"

4. 异常检测:火眼金睛的"保安队长"

一句话理解:在99个正常里找出1个不正常

  • 就像
    • 信用卡盗刷检测
    • 工厂次品识别
    • 系统入侵预警
  • 秘诀:不定义"异常什么样",只定义"正常什么样"

5. 自编码器:自学成才的"压缩大师"

一句话理解:先压缩再还原,中间学会核心特征

  • 三步走
    1. 压缩:把图片/文字变简短编码(像记要点)
    2. 存精华:只记最重要的
    3. 还原:凭要点尽量恢复原样
  • 厉害之处:完全自学,不需要老师(标签)

💡 一句话总结五个算法

  • K-means:"咱们几个一伙儿!"(硬分组)
  • PCA:"说白了就是......"(抓核心)
  • 聚类:"你们自然形成了几拨人"(软分组)
  • 异常检测:"你跟大家不太一样"(找特殊)
  • 自编码器:"我自己琢磨明白了"(自学习)

🎯 什么时候用?

  • 不知道数据有啥规律 → 先用K-means/聚类看看
  • 特征太多看花眼 → 用PCA简化
  • 想找罕见情况 → 用异常检测
  • 想让机器自己学特征 → 用自编码器

🌟 最终感悟

非监督学习就像:

  • 给你1000张没标签的照片
  • 没有人告诉你这是猫那是狗
  • 但你能自己发现:
    • 有些照片都有四条腿(聚类)
    • 最关键的特征是胡须和尾巴(PCA)
    • 某张照片特别模糊(异常)
    • 看多了自然懂"猫"的概念(自编码器)

这就是探索的乐趣------在没有地图的领域,自己画出地图。

相关推荐
naruto_lnq16 小时前
分布式系统安全通信
开发语言·c++·算法
Jasmine_llq17 小时前
《P3157 [CQOI2011] 动态逆序对》
算法·cdq 分治·动态问题静态化+双向偏序统计·树状数组(高效统计元素大小关系·排序算法(预处理偏序和时间戳)·前缀和(合并单个贡献为总逆序对·动态问题静态化
ASKED_201917 小时前
Langchain学习笔记一 -基础模块以及架构概览
笔记·学习·langchain
爱吃rabbit的mq17 小时前
第09章:随机森林:集成学习的威力
算法·随机森林·集成学习
(❁´◡`❁)Jimmy(❁´◡`❁)18 小时前
Exgcd 学习笔记
笔记·学习·算法
YYuCChi18 小时前
代码随想录算法训练营第三十七天 | 52.携带研究材料(卡码网)、518.零钱兑换||、377.组合总和IV、57.爬楼梯(卡码网)
算法·动态规划
不能隔夜的咖喱19 小时前
牛客网刷题(2)
java·开发语言·算法
VT.馒头19 小时前
【力扣】2721. 并行执行异步函数
前端·javascript·算法·leetcode·typescript
进击的小头19 小时前
实战案例:51单片机低功耗场景下的简易滤波实现
c语言·单片机·算法·51单片机
云小逸19 小时前
【nmap源码学习】 Nmap网络扫描工具深度解析:从基础参数到核心扫描逻辑
网络·数据库·学习