K-means 算法

K-means 算法

算法过程描述

  1. 随机选取k个点作为簇的中心
  2. 对于每一个样本的计算到中心的距离,并将样本分到最近的簇中
  3. 更新簇的中心位置
  4. 重复上述2-3步,直至簇的中心位置不在发生改变

其中目标函数为
J = ∑ i = 1 N ∑ k = 1 K r i , k ∣ ∣ x i − μ k ∣ ∣ 2 J=\sum_{i=1}^N\sum_{k=1}^Kr_{i,k}||x^i-\mu^k||^2 J=i=1∑Nk=1∑Kri,k∣∣xi−μk∣∣2

其中 r i , k ∈ { 0 , 1 } r_{i,k}\in\{0,1\} ri,k∈{0,1}表示样本 x i x_i xi是否属于簇 k k k

因为如果簇中心位置 μ k \mu^k μk确定,那么 r i , k r_{i,k} ri,k也同时将确定,为了优化目标函数,k-means采用迭代求解的方法,首先固定 μ k \mu^k μk,优化 r i , k r_{i,k} ri,k;然后固定 r i , k r_{i,k} ri,k优化 μ k \mu^k μk。

首先初始化簇中心,固定 μ k \mu^k μk,最小化 J ( r i , k ) J(r_{i,k}) J(ri,k):

分配每个样本点到其最近的中心点所在的簇
z i = a r g m i n k ′ dist ( x i , μ k ) { r i , k = 1 , k = z i r i , k = 0 , k ≠ z i z_i= \mathrm{arg\ min}{k^{\prime}}\text{dist}(x^i,\mu^k)\\ \begin{cases}r{i,k}=1,k=z_i\\r_{i,k}=0,k\neq z_i\end{cases} zi=arg mink′dist(xi,μk){ri,k=1,k=ziri,k=0,k=zi

然后固定簇中心 μ k \mu^k μk,最小化 J ( μ k ) J(\mu^k) J(μk):
μ k = ∑ i r i , k x i ∑ i r i , k {\mu}^k=\frac{\sum_ir_{i,k}{x}^i}{\sum_ir_{i,k}} μk=∑iri,k∑iri,kxi

相关推荐
编程绿豆侠几秒前
力扣HOT100之二叉树:199. 二叉树的右视图
算法·leetcode·职场和发展
飞川撸码1 小时前
【LeetCode 热题100】17:电话号码的字母组合(详细解析)(Go语言版)
算法·leetcode·golang·dfs
蒟蒻小袁1 小时前
力扣面试150题--从前序与中序遍历序列构造二叉树
算法·leetcode·面试
IT古董1 小时前
【漫话机器学习系列】266.雅可比矩阵(Jacobian Matrix)
人工智能·机器学习
卧式纯绿2 小时前
卷积神经网络基础(九)
人工智能·python·深度学习·神经网络·机器学习·cnn
闭月之泪舞2 小时前
初识函数------了解函数的定义、函数的参数、函数的返回值、说明文档的书写、函数的嵌套使用、变量的作用域(全局变量与局部变量)
python·算法·机器学习
GUIQU.2 小时前
【每日一题丨2025年5.12~5.18】排序相关题
算法·排序·每日一题
哪 吒2 小时前
2025B卷 - 华为OD机试七日集训第2期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)
python·算法·华为od·华为od机试·2025b卷
孤寂大仙v2 小时前
【Linux笔记】——Linux线程封装
linux·笔记·算法
欧先生^_^3 小时前
Rust 编程语言的官方源码仓库
开发语言·算法·rust