AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心

论文标题

Towards Fairer Centroids in k-means Clustering

面向更公平的 k 均值聚类中心

论文链接

Towards Fairer Centroids in k-means Clustering论文下载

论文作者

Stanley Simoes, Deepak P, Muiris MacCarthaigh

内容简介

本文提出了一种新的聚类级质心公平性(Cluster-level Centroid Fairness, CCF)概念,旨在解决传统 k 均值聚类中不同群体在聚类中心代表性上的不公平问题。作者通过引入 Fair-Centroid 方法,专注于提升每个聚类中最不利群体的代表性,从而实现更公平的聚类结果。该方法通过迭代优化框架实现,能够在保持聚类质量的同时显著降低群体间的代表性差异。实验结果表明,Fair-Centroid 在真实数据集上表现出色,为公平聚类提供了一种新的解决方案。

分点关键点

1.聚类级质心公平性(CCF)

提出了一种新的公平性概念,专注于每个聚类内部群体的代表性公平性,而非传统的数据集整体公平性。通过量化每个聚类中群体的代表性差异,CCF 能够更细致地捕捉聚类内的不公平性。

2.Fair-Centroid 方法

通过迭代优化框架实现,初始聚类分配会根据最不利群体的代表性进行调整,以提升其在每个聚类中的代表性。该方法结合了功利主义目标和公平性目标,通过超参数控制两者之间的权衡。

3.实验验证

在 Adult 和 CreditCard 数据集上验证了 Fair-Centroid 的有效性。结果表明,该方法能够在对聚类质量影响较小的情况下显著提升聚类级公平性,优于传统的 k 均值和公平 k 均值方法。

4.公平性与效用的权衡

通过调整超参数,Fair-Centroid 能够在公平性和效用之间实现平衡。实验表明,即使在较小的公平性权重下,该方法也能显著降低群体间的代表性差异,同时保持较高的聚类效用。

5.未来工作

提出了进一步优化 Fair-Centroid 的方向,包括设计更高效的算法(如线性规划松弛和线搜索)以及将该方法扩展到其他聚类算法(如 k-medoids 和模糊 c 均值)。

论文代码

代码链接:https://github.com/RyanWangZf/BioBridge


总结

本文围绕 k 均值聚类中的公平性问题展开研究,提出了一种新的聚类级质心公平性(CCF)概念,并通过 Fair-Centroid 方法实现了对每个聚类中最不利群体的代表性提升。该方法通过迭代优化框架,在保持聚类质量的同时显著降低了群体间的代表性差异。实验结果表明,Fair-Centroid 在真实数据集上表现出色,能够在对聚类效用影响较小的情况下显著提升公平性。未来工作将聚焦于优化算法效率和扩展到其他聚类范式。

AAAI2024论文合集:

AAAI2024论文合集

希望这些论文能帮到你!如果觉得有用,记得点赞关注哦~ 后续还会更新更多论文合集!!

相关推荐
忆~遂愿1 小时前
3大关键点教你用Java和Spring Boot快速构建微服务架构:从零开发到高效服务注册与发现的逆袭之路
java·人工智能·spring boot·深度学习·机器学习·spring cloud·eureka
纠结哥_Shrek1 小时前
pytorch逻辑回归实现垃圾邮件检测
人工智能·pytorch·逻辑回归
辞落山1 小时前
自定义数据集,使用 PyTorch 框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
人工智能·pytorch·逻辑回归
天宇琪云2 小时前
关于opencv环境搭建问题:由于找不到opencv_worldXXX.dll,无法执行代码,重新安装程序可能会解决此问题
人工智能·opencv·计算机视觉
大模型之路2 小时前
大模型(LLM)工程师实战之路(含学习路线图、书籍、课程等免费资料推荐)
人工智能·大模型·llm
deephub3 小时前
十大主流联邦学习框架:技术特性、架构分析与对比研究
人工智能·python·深度学习·机器学习·联邦学习
纠结哥_Shrek4 小时前
pytorch使用SVM实现文本分类
pytorch·支持向量机·分类
英国翰思教育4 小时前
留学毕业论文如何利用不同问题设计问卷
人工智能·深度学习·学习·算法·学习方法·论文笔记
gaoenyang7605254 小时前
探索高效图像识别:基于OpenCV的形状匹配利器
人工智能·opencv·计算机视觉
背太阳的牧羊人5 小时前
分词器的词表大小以及如果分词器的词表比模型的词表大,那么模型的嵌入矩阵需要被调整以适应新的词表大小。
开发语言·人工智能·python·深度学习·矩阵