-
BERTopic:
- 简介: 基于预训练的语言模型BERT(Bidirectional Encoder Representations from Transformers)的主题模型,通过将文档嵌入到BERT空间中并进行聚类,实现主题提取。
- 作者: 出自Cherubin等人的研究(2021)。
-
BigARTM (Big Additive Regularization Topic Model):
- 简介: BigARTM是一种多模态、多目标的主题模型,可以处理大规模文本集合,并且允许用户通过添加正则化项来引导主题模型学习特定的模式。
- 作者: 出自"BigARTM: Open-Source Library for Regularized Multimodal and Multilingual Topic Modeling"(2015)。
-
LDA2Vec:
- 简介: LDA2Vec是一种将词向量和主题模型(Latent Dirichlet Allocation, LDA)结合的方法,通过将LDA中的主题表示嵌入到词嵌入空间中,实现更好的语义建模。
- 作者: 出自"Dynamic Topic Models for Tracking Research Communities over Time"(2016)。
-
ETM (Embedding Topic Model):
- 简介: ETM是一种将主题嵌入到连续空间的模型,通过学习主题嵌入向量,将文档嵌入到主题空间中,以获得更丰富的语义表示。
- 作者: 出自"A Neural Probabilistic Topic Model"(2019)。
-
Biterm Topic Model (BTM):
- 简介: BTM是一种基于二项分布的主题模型,通过对文档中的词对(biterms)进行建模,实现了在大规模文本集上高效的主题建模。
- 作者: 出自"Modeling Bimodal Texts with the Biterm Topic Model"(2014)。
nlp文本主题提取算法总结
mqdlff_python2024-01-25 20:25
相关推荐
果冻人工智能36 分钟前
2025 年将颠覆商业的 8 大 AI 应用场景代码不行的搬运工37 分钟前
神经网络12-Time-Series Transformer (TST)模型石小石Orz39 分钟前
Three.js + AI:AI 算法生成 3D 萤火虫飞舞效果~孤独且没人爱的纸鹤1 小时前
【深度学习】:从人工神经网络的基础原理到循环神经网络的先进技术,跨越智能算法的关键发展阶段及其未来趋势,探索技术进步与应用挑战阿_旭1 小时前
TensorFlow构建CNN卷积神经网络模型的基本步骤:数据处理、模型构建、模型训练羊小猪~~1 小时前
tensorflow案例7--数据增强与测试集, 训练集, 验证集的构建极客代码1 小时前
【Python TensorFlow】进阶指南(续篇三)zhangfeng11331 小时前
pytorch 的交叉熵函数,多分类,二分类Seeklike1 小时前
11.22 深度学习-pytorch自动微分庞传奇1 小时前
TensorFlow 的基本概念和使用场景