吴恩达机器学习笔记 三十 什么是聚类 K-means

聚类(clustering) 是一种无监督学习算法 ,关注多个数据点并自动找到相似的数据点,在数据中找到一种特定的结构。无监督学习算法的数据集中没有标签 y ,所以不能说哪个是"正确的 y "。

K-means算法

K-means算法就是在重复做两件事:一个是把点分配给集群质心 ,另一个是移动集群的中心

例如,要求算法找到下图中的两个类,第一步随机选取两个地方 ,然后遍历每个点,看看它离那个更近

第二步:计算每个簇的中心,并把集群中心移动到这里,然后再次遍历每个点看看它离哪一个更近,然后重复,直到中心不再变化。

相关推荐
talen_hx2963 分钟前
《零基础入门Spark》学习笔记 Day 04
大数据·笔记·学习·spark
中屹指纹浏览器6 分钟前
2026指纹浏览器技术选型与性能优化实践
经验分享·笔记
m0_5649149211 分钟前
极简大模型microGPT代码教学互动网页
人工智能·机器学习
老星*11 分钟前
AppFlowy:开源笔记工具完全指南:Notion本地替代方案的完整教程
笔记·notion
Zero12 分钟前
机器学习概率论与统计学--(7)概率论:多维随机变量
机器学习·概率论·随机变量·统计学·多维随机变量
岑梓铭16 分钟前
《考研408数据结构》第三章3(数组矩阵)复习笔记
数据结构·笔记·矩阵
编程小风筝19 分钟前
机器学习的半监督学习可以实现什么功能?
人工智能·学习·机器学习
岑梓铭36 分钟前
《考研408数据结构》第三章2(栈、队列应用)复习笔记
数据结构·笔记
枫叶林FYL9 小时前
【自然语言处理 NLP】第二章 经典NLP算法与特征工程(Classical NLP Algorithms)
人工智能·深度学习·机器学习
程序员夏末10 小时前
【LeetCode | 第七篇】算法笔记
笔记·算法·leetcode