技术栈

umap

不务正业的小主治
14 天前
pca·msd·umap·简析基因·ezygene·降维分析·tsne
ezygene-降维分析降维分析是高维数据(如基因、图像)可视化与特征提取的核心方法。PCA 为主成分分析,通过线性变换提取方差最大的主成分,速度快、可解释性强,适合初步数据探索,但难以保留非线性结构。t-SNE 基于概率分布优化,擅长聚类展示,局部结构清晰,适合可视化,却计算慢、难以还原全局关系。UMAP 兼顾 t-SNE 的聚类效果与更快速度,同时保留局部与全局结构,应用更广泛。MSD(平均平方距离)侧重衡量数据离散程度,常辅助评估降维后数据分布的紧凑性与聚类质量,多用于降维效果验证与特征筛选。
AI手记叨叨
1 个月前
降维·umap
UMAP非线性降维算法UMAP,全称Uniform Manifold Approximation and Projection(均匀流形近似与投影),是一种基于流形学习理论的非线性降维算法。与传统的线性降维方法PCA相比,UMAP在保留数据的拓扑结构和局部邻域关系方面具有独特优势,尤其适用于单细胞测序、图像分析、自然语言处理等领域。本文将从原理、与PCA的关键区别、实现步骤、代码示例到参数调优,来介绍UMAP的使用方法与适用场景。
我是有底线的