gensim conherence model C_V 值与其他指标负相关BUG

在我用gensim3.8.3 conherence model分析京东评论主题模型时, C_V 与npmi、u_mass出现了强烈的皮尔逊负相关:

这些地方也反映了类似问题:

https://github.com/dice-group/Palmetto/issues/12

https://github.com/dice-group/Palmetto/issues/13

https://github.com/dice-group/Palmetto/issues/76

按道理来说,这些一致性评分都是越高越好。这里是怎么回事呢?

原来是原实现代码的gamma值搞错了,应该设置为1而不是2:

https://github.com/dice-group/Palmetto/issues/81

ps:截至2023.07.27,我电脑里的gensim版本还是3.8.1,没有更新到最新版的gensim(4.3.0),因此不知道gensim是否已修复此问题。肯折腾的朋友可以去尝试一下

相关推荐
m0_575046341 小时前
FPGA数据流分析
数据分析·fpga·数据流分析
思辨共悟2 小时前
Python的价值:突出在数据分析与挖掘
python·数据分析
用户Taobaoapi20145 小时前
京东图片搜索相似商品API开发指南
大数据·数据挖掘·数据分析
带娃的IT创业者5 小时前
《AI大模型应知应会100篇》第69篇:大模型辅助的数据分析应用开发
人工智能·数据挖掘·数据分析
彭刷子6 小时前
【Bug】Nexus无法正常启动的五种解决方法
bug·nexus
黑客飓风10 小时前
从基础功能到自主决策, Agent 开发进阶路怎么走?
面试·log4j·bug
mahuifa13 小时前
C++(Qt)软件调试---bug排查记录(36)
c++·bug·软件调试
Kyln.Wu13 小时前
【python实用小脚本-205】[HR揭秘]手工党逐行查Bug的终结者|Python版代码质量“CT机”加速器(建议收藏)
开发语言·python·bug
数据科学作家16 小时前
学数据分析必囤!数据分析必看!清华社9本书覆盖Stata/SPSS/Python全阶段学习路径
人工智能·python·机器学习·数据分析·统计·stata·spss
liliangcsdn20 小时前
Leiden社区发现算法的学习和示例
学习·数据分析·知识图谱