技术栈
聚类
Nice_cool.
4 小时前
机器学习
·
支持向量机
·
聚类
PCL八叉树聚类
//聚类结果分类渲染
慕卿扬
2 天前
笔记
·
python
·
学习
·
机器学习
·
聚类
基于python的机器学习(六)—— 数据可视化和数据预处理
目录一、数据可视化1.1 单一图表1.1.1 直方图1.1.2 密度图1.1.3 箱线图1.2 多重图表
慕卿扬
2 天前
笔记
·
python
·
学习
·
机器学习
·
聚类
基于python的机器学习(五)—— 聚类(二)
k-medoids是一种聚类算法,它是基于k-means聚类算法的一种改进。k-medoids算法也是一种迭代算法,但是它将中心点限定为数据集中的实际样本点,而不是任意的点。
缺的不是资料,是学习的心
7 天前
机器学习
·
数据挖掘
·
聚类
轮廓系数做聚类,枚举
from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score import numpy as np
Gsen2819
7 天前
人工智能
·
算法
·
机器学习
·
数据挖掘
·
聚类
聚类算法 ap 聚类 谱聚类
AP聚类(Affinity Propagation Clustering)是一种基于消息传递的聚类算法,由Brendan J. Frey和Delbert Dueck于2007年提出。与传统的聚类算法(如K-Means)不同,AP聚类不需要预先指定聚类数量,而是通过数据点之间的相似度自动确定聚类中心和聚类数量。
CyreneSimon
8 天前
oracle
·
kmeans
·
聚类
说话人分离中的聚类方法:深入解析Agglomerative聚类、KMeans聚类和Oracle聚类
说话人分离(Speaker Diarization)是将音频流根据说话人身份划分为同质片段的过程。这一过程中的关键步骤是聚类,即将说话人嵌入(embeddings)分组为不同的簇,每个簇代表一个独特的说话人。在pyannote.audio`管道中使用的三种聚类方法:层次聚类(Agglomerative Clustering)、KMeans聚类(KMeans Clustering)和Oracle聚类(Oracle Clustering)。
代码骑士
13 天前
机器学习
·
数据挖掘
·
聚类
聚类(Clustering)基础知识2
知识回顾问题描述给定 N N N个样本点 X = { x i } i = 1 N X = \{x_i\}_{i=1}^N X={xi}i=1N进行聚类。 输入
dundunmm
14 天前
论文阅读
·
深度学习
·
数据挖掘
·
聚类
【论文阅读】Self-Correcting Clustering
论文地址:代码地址:https://github.com/whx-xhw/SelfCC目标分布的引入显著提升了深度聚类的效果。然而,大多数相关的深度聚类方法存在两个主要缺陷:(1) 依赖人工设计的目标分布函数,性能存在不确定性;(2) 聚类错误分配的累积。为了解决这些问题,本文提出了一种自校正聚类(Self-CC)框架。在 Self-CC 中,设计了一种鲁棒目标分布求解器(RTDS),用于自动预测目标分布并缓解错误分配的影响。具体而言,RTDS 通过建模聚类模块的训练损失分布,将根据聚类分配结果选出的高置
Fuction.
16 天前
人工智能
·
python
·
机器学习
·
kmeans
·
聚类
聚类注意点
穆易青
16 天前
机器学习
·
数据挖掘
·
聚类
·
clustering
·
genefiltering
2025.03.26【基因数据解析】| BackSPIN:高效基因聚类与过滤工具详解
在单细胞RNA测序(scRNA-seq)数据的分析中,BackSPIN(Backward SPIN)是一个创新的双向双聚类算法。该算法的核心思想是在聚类细胞的同时,将高表达基因聚集在一起,从而揭示细胞亚群和基因表达模式之间的复杂关系。BackSPIN通过计算每次分裂后每个簇中的平均基因表达量,并将每个基因分配到表达量最高的簇中,有效地识别出细胞亚群特异性的Marker基因。这种方法不仅提高了聚类的准确性,还为后续的生物学解释和实验验证提供了重要线索。BackSPIN的算法设计巧妙地结合了聚类分析和基因表达
代码骑士
16 天前
算法
·
支持向量机
·
聚类
聚类(Clustering)基础知识3
聚类性能评价方法主要分为两种:利用 ( a , b , c , d ) (a, b, c, d) (a,b,c,d)定义外部评价指标:
编程在手天下我有
17 天前
算法
·
均值算法
·
聚类
K-均值聚类算法:数据海洋中的分类灯塔
K-均值聚类的核心在于基于数据点间的相似度来划分数据。相似度常以距离衡量,目标是将数据分成K个组,让同组内数据点“亲密无间”,不同组数据点“界限分明”。通过不断调整聚类中心,使每个数据点到所属聚类中心的距离平方和(即误差平方和SSE)最小。数学表达式为 ,其中Ci是第i个聚类,ui是其中心,d(x,ui)是数据点x到中心ui的距离。算法就像一位执着的工匠,力求找到使SSE最小的聚类方式,打造出最合理的聚类结构 。
@you_123
23 天前
算法
·
3d
·
聚类
3D点云数据处理中的聚类算法总结
基于点的空间距离(欧几里得距离)来分割点云,将距离较近的点归为同一簇。 欧式聚类需要的参数:邻域半径R,簇的最小点阈值minPts,最大点数阈值maxPts。 实现效率: O(n * log n) 实现步骤: (1)从未访问点开始探索:对于点云中的每一个未访问的点,进行以下步骤: (2)区域查询:使用空间索引(如KD树)查找在以当前点为中心、半径为R的邻域内的所有点。如果邻域内的点数量大于或等于最小点阈值minPts,则将该点标记为一个新的聚类中心。 (3)扩展聚类:从这个聚类中心出发,继续探索邻域内的点
穆易青
25 天前
机器学习
·
数据挖掘
·
聚类
·
clustering
·
genenetworks
·
visualisation
2025.03.21【基因分析】| SCENIC:基因网络聚类与可视化工具详解
在生物信息学领域,单细胞RNA-seq技术已经成为研究细胞异质性和复杂生物学过程的强大工具。SCENIC(Single-Cell ENrichment of Inferred Cellular states)正是在这样的背景下应运而生,它专门设计用于识别和分析与特定基因集或调控网络相关的细胞状态。通过结合基因表达数据和已知的基因调控网络,SCENIC能够推断出细胞的调控状态,这对于理解复杂的生物学过程和疾病机制至关重要。
胡耀超
1 个月前
python
·
机器学习
·
数据挖掘
·
matplotlib
·
聚类
·
可视化
·
seaborn
4.玩转热图(相关矩阵、缺失值、多维相关、聚类热图、时间序列)——Python数据挖掘代码实践
下面的表格对比了 9 种常见热图类型,从定义与用途、适用场景、常用工具,到优缺点,帮助您从多个角度理解和选择适合业务需求的热图形式。这不仅有助于数据探索和特征筛选,也为数据治理提供了直观的支持。
FAREWELL00075
1 个月前
python
·
信息可视化
·
聚类
实验三 Python 数据可视化 && Python 聚类-K-means(CQUPT)
Python 数据可视化:1、学习使用 jieba、wordcloud 等类库生成词云图。2、学习使用 Matplotlib 库进行数据可视化。
Wis4e
1 个月前
人工智能
·
数据挖掘
·
聚类
数据挖掘导论——第七章:聚类
什么是聚类?数据间的相似性和距离的测量方式有哪些?数据标准化如何进行距离计算?层次聚类的思想和流程?K-均值聚类的思想和流程?距离的计算方式如何影响聚类结果?
Sodas(填坑中....)
1 个月前
人工智能
·
机器学习
·
数据挖掘
·
聚类
周志华机器学习西瓜书 第九章 聚类-学习笔记
聚类是无监督学习中非常典型的任务,聚类的目的是将数据样本划分为若干个通常不相交的子集,每一个子集成为"簇-cluster",其即可以作为一个单独过程,用于找寻数据内在的分布结构,也可作为分类等其他学习任务的前驱过程。
dundunmm
1 个月前
人工智能
·
数据挖掘
·
聚类
·
kl散度
【数据挖掘】KL散度(Kullback-Leibler Divergence, KLD)
KL散度(Kullback-Leibler Divergence, KLD) 是衡量两个概率分布 P 和 Q之间差异的一种非对称度量。它用于描述当使用分布 Q 逼近真实分布 P 时,信息丢失的程度。
SomeB1oody
1 个月前
python
·
算法
·
机器学习
·
聚类
·
分类算法
【Python机器学习】2.2. 聚类分析算法理论:K均值聚类(KMeans Analysis)、KNN(K近邻分类)、均值漂移聚类(MeanShift)
喜欢的话别忘了点赞、收藏加关注哦(关注即可查看全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(=・ω・=)