DEC 深度编码聚类函数

2. 辅助目标函数

要使用输入 (bt, groups, embed_dim) 计算 DEC 模型的目标分布,关键部分是使用软分配 q ,其形状为 (bt, groups, max_cluster) 。这里, max_cluster 是您要定位的集群数量。当您沿该维度执行聚类时,需要跨 groups 维度计算目标分布。

The process is:其过程是:

  1. 对软分配进行平方 ( q ):这会放大高概率分配并抑制较低概率分配。

  2. 对 groups 维度求和:您对 groups 维度(张量中的索引 1)上的这些平方概率求和,因为您想要捕获每个组在所有集群中的分布批次中的项目。

  3. 归一化:然后对求和值进行归一化,以确保它们形成正确的概率分布。

目标分布计算如下所示:

python 复制代码
def target_distribution(q):
    # Square the probabilities and sum across the 'groups' dimension
    weight = q ** 2 / q.sum(1, keepdim=True)

    # Normalize across the 'max_cluster' dimension
    return (weight / weight.sum(2, keepdim=True))

在这个函数中:

  • q.sum(1, keepdim=True) 对 groups 维度上的概率平方求和,得到形状 (bt, 1, max_cluster) 的张量。
  • weight / weight.sum(2, keepdim=True) 然后在 max_cluster 维度(张量中的索引 2)对这些概率进行归一化,确保每个簇的概率总和为 1。这会产生相同形状的张量如 q ( (bt, groups, max_cluster) )。
  • 目标分布的计算符合数据结构和 DEC 算法的要求。
相关推荐
B站计算机毕业设计之家几秒前
大数据项目:基于python电商平台用户行为数据分析可视化系统 电商订单数据分析 Django框架 Echarts可视化 大数据技术(建议收藏)
大数据·python·机器学习·数据分析·django·电商·用户分析
Chase_______4 分钟前
AI 提升效率指南:如何高效书写提示词
人工智能·ai·prompt
数据猿15 分钟前
【“致敬十年”系列】专访中国商联数据委会长邹东生:以“最小化场景闭环”实现AI真价值
大数据·人工智能
杰瑞不懂代码16 分钟前
【公式推导】AMP算法比BP算法强在哪(二)
python·算法·机器学习·概率论
无垠的广袤17 分钟前
【工业树莓派 CM0 NANO 单板计算机】小智语音聊天
人工智能·python·嵌入式硬件·语言模型·树莓派·智能体·小智
智算菩萨17 分钟前
深度学习在软件工程领域的系统性研究综述:理论、方法与实践
人工智能·深度学习·软件工程
这张生成的图像能检测吗19 分钟前
(论文速读)DreamOmni:统一的图像生成和编辑
人工智能·深度学习·计算机视觉·图像生成、编辑
工藤学编程27 分钟前
零基础学AI大模型之新版LangChain向量数据库VectorStore设计全解析
数据库·人工智能·langchain
-大头.30 分钟前
2025 Maven终极实战:AI与云原生构建新范式
人工智能·云原生·maven
专注数据的痴汉30 分钟前
「数据获取」中华人民共和国乡镇行政区划简册(2010-2017)(2011-2012缺失)
大数据·人工智能·信息可视化