Multicore-TSNE

文章目录

TSNE

  • t-Distributed Stochastic Neighbor Embedding (t-SNE) 是一种高维数据的降维方法,由Laurens van der Maaten和Geoffrey Hinton于2008年提出,通常用于数据可视化。其大致原理是在低维(通常是2D或3D)空间中保留高维空间中的距离关系

使用scikit-learn库

使用Multicore-TSNE库

  • Multicore-TSNE的项目地址:
    https://github.com/DmitryUlyanov/Multicore-TSNE

  • 优点:

    • 使用方法与与scikit-learn库基本一致
    • 计算速度相对于scikit-learn库可大幅提升
  • 缺点:

    • 功能相比scikit-learn库大幅减少
    • 默认仅实现了基于欧式距离的降维计算

安装方法

  • 方法1:直接pip安装
bash 复制代码
pip install MulticoreTSNE
  • 方法2:源码编译安装
bash 复制代码
git clone https://github.com/DmitryUlyanov/Multicore-TSNE.git
cd Multicore-TSNE/
pip install .

基本使用方法

  • Multicore-TSNE库的基本使用方法非常简单,与scikit-learn库基本一致:
python3 复制代码
from MulticoreTSNE import MulticoreTSNE as TSNE

tsne = TSNE(n_jobs=4)
Y = tsne.fit_transform(X)

采用不同的距离度量

  • Multicore-TSNE默认仅实现了基于欧式距离的降维计算,然而,很多时候,我们希望采用其他距离度量。幸运的是,根据 https://github.com/DmitryUlyanov/Multicore-TSNE/issues/49 中的回答,已有大佬基于Multicore-TSNE库进行了二次开发,其中可以采用的距离度量包括:
    • Euclidean distance
    • Squared euclidean distance
    • Angular distance
    • Cosine distance (not a real metric)
    • Precomputed distance marix
  • 安装方式:源码编译安装
bash 复制代码
git clone https://github.com/asanakoy/Multicore-TSNE.git
cd Multicore-TSNE/
pip install .
  • 以手动计算特征向量之间的余弦距离为例:
python3 复制代码
from MulticoreTSNE import MulticoreTSNE as TSNE
from sklearn.metrics.pairwise import cosine_similarity

# 计算余弦相似度矩阵
similarity_matrix = cosine_similarity(feats.cpu().numpy())

# 将余弦相似度转换为距离矩阵
distance_matrix = 1 - similarity_matrix

tsne = TSNE(n_jobs=4, metric="precomputed", random_state=42)
X_tsne = tsne.fit_transform(distance_matrix)

其他资料

相关推荐
@解忧杂货铺5 分钟前
基于用户的协同过滤推荐算法实现(Java电商平台)
算法·机器学习·推荐算法
MilesShi21 分钟前
AI Agent实战 - LangChain+Playwright构建火车票查询Agent
人工智能·python·机器学习
Python当打之年2 小时前
【59 Pandas+Pyecharts | 淘宝华为手机商品数据分析可视化】
华为·智能手机·数据分析·pandas·数据可视化
摘取一颗天上星️2 小时前
端到端记忆网络 vs 神经图灵机:外部记忆的两种哲学之争
网络·人工智能·深度学习·机器学习·lstm·外部记忆
要努力啊啊啊4 小时前
YOLOv3 训练与推理流程详解-结合真实的数据样例进行模拟
人工智能·yolo·机器学习·计算机视觉·目标跟踪
Takina~4 小时前
python打卡day53
python·深度学习·机器学习
Blossom.1185 小时前
基于深度学习的智能图像分类系统:从零开始构建
开发语言·人工智能·python·深度学习·神经网络·机器学习·分类
硅谷秋水14 小时前
NORA:一个用于具身任务的小型开源通才视觉-语言-动作模型
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
蓝皮怪14 小时前
数据可视化——一图胜千言
数据可视化·统计学·基础教学·理论学习
mwicogito16 小时前
实验复现:应用 RIR 触发器的 TrojanRoom 后门攻击实现
人工智能·python·机器学习·语音识别·后门攻击