计算各聚类中心

任务描述

本关实现一个函数来计算各簇的中心。

相关知识

在前一个关卡中,我们实现了一个函数来计算距离每个样本最近的簇中心,这样每一个样本都有了所属的簇团,从而将一堆数据分成了 n 个簇,也就是 n 个类。

K-means 算法是一个迭代优化算法,每次迭代我们需要重新计算簇的中心。一般就是通过计算每个簇类所有样本的平均值来获得。可以使用 Numpy 里面的 mean 方法np.mean(x,0)来计算均值。

编程任务

本关卡要求你实现函数 estimate_centers,在右侧编辑器 Begin-End 区间补充代码,需要填充的代码块如下:

复制代码
  1. # -*- coding: utf-8 -*-
  2. import numpy as np
  3. def estimate_centers(X, y_estimated, centers):
  4. """重新计算各聚类中心
  5. 参数:
  6. X - numpy二维数组,代表数据集的样本特征矩阵
  7. y_estimated - numpy数组,估计的各个样本的聚类中心索引
  8. n_clusters - 整数,设定的聚类个数
  9. 返回值:
  10. centers - numpy二维数组,各个样本的聚类中心
  11. """
  12. centers = np.zeros((n_clusters, X.shape[1]))
  13. # 请在此添加实现代码 #
  14. #********** Begin *********#
  15. #********** End ***********#
  16. return centers
测试说明

输入一组向量(数据集)、一个数组(每个元素分配的类中心编号)和一组向量(各聚类中心),输出一组向量(各聚类中心)。平台比对函数 estimate_centers 的输出结果与正确结果的差异,只有完全正确才能进入下一关。

代码:

python 复制代码
# -*- coding: utf-8 -*-
def estimate_centers(X, y_estimated, n_clusters):
    """重新计算各聚类中心
    参数:
        X - numpy二维数组,代表数据集的样本特征矩阵
        y_estimated - numpy数组,估计的各个样本的聚类中心索引
        n_clusters - 整数,设定的聚类个数
    返回值:
        centers - numpy二维数组,各个样本的聚类中心
    """
    import numpy as np
    centers = np.zeros((n_clusters, X.shape[1]))
    #   请在此添加实现代码     #
    #********** Begin *********#
    for i in range(n_clusters):
        centers[i] = np.mean(X[y_estimated==i], 0)
    #********** End ***********#
    return centers    
相关推荐
Mr.看海1 小时前
机器学习鼻祖级算法——使用SVM实现多分类及Python实现
算法·机器学习·支持向量机
minhuan4 小时前
构建AI智能体:六十八、集成学习:从三个臭皮匠到AI集体智慧的深度解析
人工智能·机器学习·adaboost·集成学习·bagging
Cathy Bryant4 小时前
大模型推理(九):采样温度
笔记·神经网络·机器学习·数学建模·transformer
hhhLLyi5 小时前
营销人职业成长路径:从执行到战略的能力进阶与知识体系构建
信息可视化·数据挖掘·数据分析
编码浪子5 小时前
对LlamaFactory的一点见解
人工智能·机器学习·数据挖掘
长桥夜波5 小时前
【第十八周】机器学习笔记07
人工智能·笔记·机器学习
音视频牛哥6 小时前
从“小而美”到“大而强”:音视频直播SDK的技术进化逻辑
机器学习·计算机视觉·音视频·大牛直播sdk·人工智能+·rtsp播放器rtmp播放器·rtmp同屏推流
bmcyzs15 小时前
【展厅多媒体】触摸查询一体机实现数据可视化
经验分享·科技·信息可视化·数据挖掘·数据分析·设计规范
丁浩66617 小时前
Python机器学习---2.算法:逻辑回归
python·算法·机器学习
B站_计算机毕业设计之家17 小时前
计算机毕业设计:Python农业数据可视化分析系统 气象数据 农业生产 粮食数据 播种数据 爬虫 Django框架 天气数据 降水量(源码+文档)✅
大数据·爬虫·python·机器学习·信息可视化·课程设计·农业