聚类

l12345sy3 小时前
算法·机器学习·kmeans·聚类·sse·sc·ch
Day23_【机器学习—聚类算法—K-Means聚类 及评估指标SSE、SC、CH】属于无监督学习算法,即有特征无标签,根据样本之间的相似性,将样本划分到不同的类别中。所谓相似性可以理解为欧氏距离、曼哈顿距离、切比雪夫距离... 。
qq_4696035897 小时前
算法·kmeans·聚类·聚类算法·k-means聚类推荐
2026新选题:基于K-Means实现学生求职意向聚类推荐职位作者简介:Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验,被多个学校常年聘为校外企业导师,指导学生毕业设计并参与学生毕业答辩指导,有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作
非门由也7 小时前
机器学习·聚类·sklearn
《sklearn机器学习——聚类性能指标》Fowlkes-Mallows 得分Fowlkes-Mallows (FM) 得分是一种用于评估聚类算法性能的外部指标,它衡量的是聚类结果与某个参考模型(通常是真实标签)之间的一致性。该指标特别适用于需要将聚类结果与已知类别进行比较的场景。
非门由也1 天前
机器学习·聚类·sklearn
《sklearn机器学习——聚类性能指标》Silhouette 系数轮廓系数(Silhouette Coefficient)是一种用于评估聚类算法性能的内部指标,它不需要真实的类别标签,仅根据数据本身的聚类结果来衡量聚类的质量。该指标能够同时反映聚类的凝聚度(Cohesion,簇内紧密性)和分离度(Separation,簇间分离性)。
非门由也2 天前
机器学习·聚类·sklearn
《sklearn机器学习——聚类性能指数》同质性,完整性和 V-measure给定一组样本的真实标签 CCC 和预测的聚类标签 KKK,同质性的计算基于条件熵的概念:H(C∣K)=−∑k∈K∑c∈C∣ck∣nlog⁡(∣ck∣∣k∣) H(C|K) = -\sum_{k \in K} \sum_{c \in C} \frac{|c_k|}{n} \log \left( \frac{|c_k|}{|k|} \right) H(C∣K)=−k∈K∑c∈C∑n∣ck∣log(∣k∣∣ck∣)
骑驴看星星a2 天前
机器学习·数据挖掘·聚类
三维聚类建模“采用K-means三维聚类方法,以孕妇BMI、首次Y染色体浓度达标孕周和达标时浓度为特征,将男胎孕妇分为3组。每组的中心特征分别为……,可据此为不同特征孕妇推荐更合理的NIPT检测时点。”
非门由也2 天前
机器学习·聚类·sklearn
《sklearn机器学习——聚类性能指标》调整兰德指数、基于互信息(mutual information)的得分评估聚类算法的性能并不像统计错误数量或计算监督分类算法的准确率和召回率那么简单。特别是任何度量指标不应考虑簇标签的绝对值,而是如果这个聚类方式分离的数据类似与一些真实类或满足某些假设,这样在同于一个相似性度量下,属于同一个类内的成员比不同类的成员更加类似。
王小王-1235 天前
大数据·hadoop·聚类·层次聚类·电子游戏销售分析·游戏数据分析
基于Hadoop与层次聚类技术的电子游戏销售分析系统的设计与实现近年来,全球电子游戏产业进入了高速发展的新阶段。随着互联网的普及、智能终端的广泛使用以及云计算和大数据等新一代信息技术的应用,电子游戏逐渐由传统的娱乐产品发展为融合科技、文化与经济的重要产业。根据全球市场研究机构的预测,电子游戏市场规模已突破数千亿美元,其中移动游戏凭借其便捷性和庞大的用户基础,市场份额持续扩大,甚至超越了传统的主机游戏与PC游戏。
MisterZhang6668 天前
java·人工智能·机器学习·自然语言处理·nlp·聚类
Java使用apache.commons.math3的DBSCAN实现自动聚类K-Means: 如果你能大致估计出类别的数量,K-Means通常也是一个高效的选择。但它对异常值敏感,且要求簇是球状的。对于一些不知道数据可能会有多少类别的时候,可用试试DBSCAN算法,因为你通常无法预先知道文章会自动分成多少类(K值未知),用DBSCAN是非常不错的,能自动判断拿出类别数量,这里讲解一下java的math3里面自带方法
做科研的周师兄8 天前
javascript·人工智能·算法·机器学习·支持向量机·聚类
【机器学习入门】4.1 聚类简介——从“物以类聚”看懂无监督分组的核心逻辑你一定听过 “物以类聚,人以群分” 这句话 —— 把味道相似的零食归为一类,把兴趣相近的朋友分成小圈子,这些日常行为其实都藏着 “聚类” 的思想。在机器学习中,聚类是无监督学习的核心任务,它不需要提前给数据贴标签,就能自动把 “相似的对象” 归为一组。
tainshuai14 天前
机器学习·均值算法·聚类
从零开始理解 K 均值聚类:原理、实现与应用聚类属于机器学习中的 “无监督学习”—— 也就是说,我们手里只有数据,没有提前标注的 “标签”(比如 “这是高消费客户”“这是低消费客户”)。聚类的核心思想很简单:让相似的样本聚在一起,不相似的样本分开。
辞--忧14 天前
算法·kmeans·聚类
K-Means 聚类算法详解与实战指南在机器学习的世界里,聚类算法就像一位 “自动分类大师”,能在没有标签的情况下将相似数据聚为一类。其中,K-Means 算法以其简单高效的特点成为最常用的聚类方法之一。本文将从基础概念到代码实战,全方位带你掌握 K-Means 算法的核心原理与应用技巧。
尤超宇14 天前
算法·均值算法·聚类
K 均值聚类(K-Means)演示,通过生成笑脸和爱心两种形状的模拟数据,展示了无监督学习中聚类算法的效果。以下是详细讲解:生成两种空间上分离的形状(笑脸和爱心)数据,然后用 K 均值聚类算法自动将它们分为两类,验证聚类算法对 “空间分离明显的数据” 的分类能力。
小五12717 天前
算法·机器学习·聚类
机器学习聚类算法无监督学习(无标签数据)目标:将相似数据分到同一组度量类型公式特点适用场景欧式距离√(∑(x_i - y_i)²)
初学小刘17 天前
算法·机器学习·聚类
机器学习中的聚类与集成算法:从基础到应用在机器学习的广阔领域中,聚类和集成算法是两种极具影响力的技术。它们在数据挖掘、模式识别、预测分析等多个领域发挥着重要作用。本文将深入探讨这两种算法的基本原理、应用场景以及它们在实际问题中的表现,帮助读者更好地理解和应用这些强大的工具。
zhangfeng113319 天前
算法·机器学习·聚类
DBSCAN算法详解和参数优化,基于密度的空间聚类算法,特别擅长处理不规则形状的聚类和噪声数据DBSCAN算法详解DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的空间聚类算法,特别擅长处理不规则形状的聚类和噪声数据。1996年由Martin Ester等人提出,是机器学习中最重要的聚类算法之一。
dundunmm20 天前
机器学习·支持向量机·聚类·时序·时序聚类
【每天一个知识点】时间序列聚类如果把数据比作一本书,那么时间序列(Time Series)就是一本按时间顺序记录事件的日记。它可能是股票每天的价格波动、某台机器的温度曲线、一个城市的空气质量变化,甚至是人的心电信号。时间序列聚类,就是要帮这些“日记”找到志同道合的伙伴——那些经历相似、变化趋势类似的“故事”。
WBluuue21 天前
python·机器学习·数学建模·爬山算法·启发式算法·聚类·模拟退火算法
数学建模:智能优化算法有点意思吼。首先,需要明确“群体智能”这个概念。群体智能就是群体动物或昆虫的集体行为,比如蚂蚁,鸟群,鱼群等,核心思路就是通过模拟这些群体的行为来对问题进行优化的。
TS的美梦1 个月前
python·数据分析·聚类·单细胞转录组·scanpy
scanpy单细胞转录组python教程(四):单样本数据分析之降维聚类及细胞注释接上节(scanpy单细胞转录组python教程(一):不同形式数据读取,scanpy单细胞转录组python教程(二):单样本数据分析之数据质控,scanpy单细胞转录组python教程(三):单样本数据分析之数据标准化、特征选择、细胞周期计算、回归等)。这一节是scanpy单细胞分析流程的最后一个内容了,完成降维聚类及细胞注释,这里我们还是推荐使用marker手动注释,自动注释这里先不演示。完成细胞注释,获得的结果是后续所有分析的基石。
WeiJingYu.1 个月前
机器学习·kmeans·聚类
K-Means 聚类K-mean聚类是一种无监督学习算法,核心是将数据分为K个簇。通过随机选K个初始质心,计算样本与质心距离并归类,再更新各簇质心,重复迭代至质心稳定。它简单高效,适用于大规模数据,但需预先确定K值,结果易受初始质心影响,常用于客户分群、图像分割等场景。