Unsupervised Deep Embedding for Clustering Analysis

0. 论文信息

  • 标题:Unsupervised Deep Embedding for Clustering Analysis
  • 期刊:International Conference on Machine Learning
  • 作者:Junyuan Xie,Ross Girshick,Ali Farhadi
  • 机构:University of Washington,Facebook AI Research (FAIR)
  • 代码链接:https://github.com/vlukiyanov/pt-dec

1. 摘要

聚类是许多数据驱动应用领域的核心,在距离函数和分组算法方面得到了广泛的研究。相对较少的工作集中在学习聚类表示上。在本文中,我们提出了深度嵌入聚类(DEC),这是一种使用深度神经网络同时学习特征表示和聚类分配的方法。DEC学习从数据空间到低维特征空间的映射,在该空间中迭代优化聚类目标。我们对图像和文本语料库的实验评估显示出比最先进的方法的显着改进。

2. 实验结果


3. 主要贡献

  • 深度嵌入和聚类的联合优化;
  • 通过软分配进行新颖的迭代细化;
  • 在聚类精度和速度方面最先进的聚类结果。

4. 方法


5. 总结 & 限制性

本文提出了一种在联合优化特征空间中对一组数据点进行聚类的算法Deep Embedding Clustering。DEC 通过迭代优化具有自训练目标分布的基于 KL 散度的聚类目标来工作。该方法可以看作是半监督自我训练的无监督扩展。该框架提供了一种学习专门用于聚类的表示的方法,而无需groundtruth集群成员标签。实证研究表明提出的算法的强度。DEC 在超参数设置方面提供了更好的性能和鲁棒性,这在无监督任务中尤其重要,因为交叉验证是不可能的。DEC 还具有数据点数量的线性复杂性,使其能够扩展到大型数据集。

相关推荐
zeroporn19 天前
以玄幻小说方式打开深度学习词嵌入算法!! 使用Skip-gram来完成 Word2Vec 词嵌入(Embedding)
人工智能·深度学习·算法·自然语言处理·embedding·word2vec·skip-gram
一个处女座的程序猿21 天前
LLMs之Embedding:Qwen3 Embedding的简介、安装和使用方法、案例应用之详细攻略
llm·embedding
酌沧22 天前
Qwen3 Embedding 结构-加载-训练 看透模型设计哲学
人工智能·embedding
羊小猪~~23 天前
【NLP入门系列三】NLP文本嵌入(以Embedding和EmbeddingBag为例)
人工智能·深度学习·神经网络·自然语言处理·大模型·nlp·embedding
jieshenai23 天前
MTEB:基于 Embedding 的文本分类评估与实战解析
人工智能·分类·embedding
LeeZhao@25 天前
【狂飙AGI】第6课:前沿技术-文生图(系列2)
人工智能·自然语言处理·aigc·embedding·agi
LeeZhao@1 个月前
【狂飙AGI】第4课:前沿技术-具身智能
语言模型·自然语言处理·aigc·embedding·agi
wshzd1 个月前
LLM之RAG实战(五十六)| Ollama部署下载Qwen3-Embedding向量模型和Qwen3-Reranker重排模型
embedding
Python测试之道1 个月前
RAG实战:基于LangChain的《肖申克的救赎》知识问答系统构建指南
langchain·embedding·rag·deepseek
AlfredZhao1 个月前
曾经风光无限的 Oracle DBA 已经落伍了吗?
ai·vector·embedding·onnx·hnsw·ivf