gensim conherence model C_V 值与其他指标负相关BUG

在我用gensim3.8.3 conherence model分析京东评论主题模型时, C_V 与npmi、u_mass出现了强烈的皮尔逊负相关:

这些地方也反映了类似问题:

https://github.com/dice-group/Palmetto/issues/12

https://github.com/dice-group/Palmetto/issues/13

https://github.com/dice-group/Palmetto/issues/76

按道理来说,这些一致性评分都是越高越好。这里是怎么回事呢?

原来是原实现代码的gamma值搞错了,应该设置为1而不是2:

https://github.com/dice-group/Palmetto/issues/81

ps:截至2023.07.27,我电脑里的gensim版本还是3.8.1,没有更新到最新版的gensim(4.3.0),因此不知道gensim是否已修复此问题。肯折腾的朋友可以去尝试一下

相关推荐
X***E4634 小时前
前端数据分析应用
前端·数据挖掘·数据分析
毕设源码-邱学长4 小时前
【开题答辩全过程】以 海鲜市场销售数据分析与预测系统为例,包含答辩的问题和答案
数据挖掘·数据分析
最晚的py11 小时前
Python Matplotlib
python·数据分析
麦烤楽鸡翅13 小时前
简单迭代法求单根的近似值
java·c++·python·数据分析·c·数值分析
咚咚王者13 小时前
人工智能之数据分析 numpy:第十五章 项目实践
人工智能·数据分析·numpy
B站计算机毕业设计之家15 小时前
基于Python音乐推荐系统 数据分析可视化 协同过滤推荐算法 大数据(全套源码+文档)建议收藏✅
python·数据分析·推荐算法
得物技术15 小时前
从数字到版面:得物数据产品里数字格式化的那些事
前端·数据结构·数据分析
百度Geek说17 小时前
破局复杂业务场景:百度数据分析平台(TDA)分析增强与性能优化的双轮驱动
数据分析
以梦为马mmky21 小时前
25上海应用技术大学通信考情数据分析
数据分析·通信考研·信号与系统·上海应用技术大学