matlab 实现模糊C均值聚类

1. 原理

模糊c均值算法步骤:

  1. 设定聚类数目c和加权指数b:

  2. 初始化各个聚类中心m

  1. 重复下面的运算,直到各个样本的隶属度值稳定:用当前的聚类中心根据下式计算隶属度函数:

用当前的隶属度函数按下式更新计算各类聚类中心:

当模糊C均值算法收敛时,就得到了各类的聚类中心和各个样本对于各类的隶属度值,从而完成了模糊聚类划分

Matlab中模糊c均值聚类函数(b=2):

Center,U,obj_fcn\]=fcm(data,cluster_n) data:要聚类的数据集合,每一行为一个样本; cluster_n:聚类数; Center:最终的聚类中心矩阵,每一行为聚类中心的坐标值; U:最终的模糊分区矩阵; obj_fcn:在迭代过程中的目标函数值。 ## 2. 过程 ### 2.1 数据集合并及可视化 ![](https://file.jishuzhan.net/article/1766375306697904130/b5b553864d385a0234325407c0343002.webp) ![](https://file.jishuzhan.net/article/1766375306697904130/0b0afe0fe36e9dcdcdca5dca27a75f79.webp) 将MALE.txt和FEMALE.txt文件合并成一个data.txt文件,在matlab中导入data文件并绘制样本点分布: ![](https://file.jishuzhan.net/article/1766375306697904130/e954d1ddadde77958077447c30247fa1.webp) 图1 初始样本点分布图 ### 2.2 模糊c均值聚类 调用MATLAB中模糊c均值聚类函数fcm实现聚类,初始设置聚类簇的个数为2,求出每个样本的最大隶属度,然后找出分别属于两类样本的点并绘制图像: ![](https://file.jishuzhan.net/article/1766375306697904130/25c3a7b11b09e597a8f2edda589c1e79.webp) 程序如上图所示,运行后聚类结果如下: ![](https://file.jishuzhan.net/article/1766375306697904130/6066cc914845adb81b39b23bc375ae75.webp) 图2 迭代过程中目标函数值 可以看出目标函数值在迭代中是不断减小的 ![](https://file.jishuzhan.net/article/1766375306697904130/9581ba2766a8571dd7348f99f61f8f57.webp) 图3 聚类结果 ![](https://file.jishuzhan.net/article/1766375306697904130/75774f01d3dfb1ea6fcdab3f3d949f31.webp) 图4 簇为2聚类结果样本点分布 为了能够寻找到更合理的聚类数目,接下来分别进行3类、4类、5类聚类 ![](https://file.jishuzhan.net/article/1766375306697904130/ceb962cdf4eef8538fd759ef6b1bff52.webp) 图5 簇个数为3 ![](https://file.jishuzhan.net/article/1766375306697904130/6a3d1f884da35e663ce6190126f9a2dd.webp) 图6 簇个数为4 ![](https://file.jishuzhan.net/article/1766375306697904130/260175bef6b24330dfe8cbe026c89abf.webp) 图7 簇个数为5 ## 3. 结果与分析 在上述实验过程中,我们成功实现了模糊c均值聚类,因为数据集是由两类样本合成的所以初始聚类簇的个数设置为2,结果如图4所示,然后从图中可以发现聚类效果似乎并非最佳,于是后续又增大了簇的个数进行多次实验,如图5到图7所示,通过观察可知聚类个数为4时或许会更加合理。在实验迭代的过程中可以了解到这种聚类的方式主要是通过优化目标函数然后得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行聚类的目的。同时我也通过改变聚类个数的方式去寻找更加合理的类别数。但是实验中还缺少对于聚类优劣的描述,可以通过一些聚类指标来对实验进行进一步优化。

相关推荐
其实秋天的枫1 小时前
【26大英赛】全国大学生英语竞赛C类历年真题及答案电子版PDF(2012-2025年)
经验分享·pdf
优化控制仿真模型3 小时前
【26年四级最新】英语四级高频核心词汇1500+真题PDF电子版
经验分享·pdf
foundbug9993 小时前
无人机离散系统模型预测控制(MPC)MATLAB实现
开发语言·matlab·无人机
沪漂阿龙3 小时前
大语言模型时代的无监督学习:聚类与降维全解析
人工智能·机器学习·语言模型·聚类
优化控制仿真模型4 小时前
2026年新高考英语大纲词汇表3500个电子版PDF(含正序版、乱序版和默写版)
经验分享·pdf
程序阿北6 小时前
Claude Code v2.1.88 新增 NO_FLICKER 模式:无闪烁渲染 + 鼠标支持
经验分享
luj_17686 小时前
从R语言想起的,。。。
服务器·c语言·开发语言·经验分享·算法
挂科边缘7 小时前
image-restoration-sde复现,图像修复,使用均值回复随机微分方程进行图像修复,ICML 2023
算法·均值算法·ir-sde·扩散模块图像修复
openallzzz7 小时前
毕业项目技术辅导:前后端与数据分析模块协作
经验分享·毕业设计·课程设计·大作业
LaughingZhu16 小时前
Product Hunt 每日热榜 | 2026-04-05
前端·数据库·人工智能·经验分享·神经网络