gensim conherence model C_V 值与其他指标负相关BUG

在我用gensim3.8.3 conherence model分析京东评论主题模型时, C_V 与npmi、u_mass出现了强烈的皮尔逊负相关:

这些地方也反映了类似问题:

https://github.com/dice-group/Palmetto/issues/12

https://github.com/dice-group/Palmetto/issues/13

https://github.com/dice-group/Palmetto/issues/76

按道理来说,这些一致性评分都是越高越好。这里是怎么回事呢?

原来是原实现代码的gamma值搞错了,应该设置为1而不是2:

https://github.com/dice-group/Palmetto/issues/81

ps:截至2023.07.27,我电脑里的gensim版本还是3.8.1,没有更新到最新版的gensim(4.3.0),因此不知道gensim是否已修复此问题。肯折腾的朋友可以去尝试一下

相关推荐
害羞的白菜31 分钟前
基于Axure+墨刀设计的电梯管理系统云台ERP的中保真原型图
数据分析·产品经理·axure·项目经理·墨刀
神膘护体小月半1 小时前
bug 记录 - 使用 el-dialog 的 before-close 的坑
前端·javascript·bug
Leo.yuan1 小时前
实时数据仓库是什么?数据仓库设计怎么做?
大数据·数据库·数据仓库·数据分析·spark
仟濹2 小时前
「数据分析 - Pandas 函数」【数据分析全栈攻略:爬虫+处理+可视化+报告】
爬虫·数据分析·pandas
顽强d石头6 小时前
bug:undefined is not iterable (cannot read property Symbol(Symbol.iterator))
前端·bug
viperrrrrrrrrr718 小时前
大数据学习(128)-数据分析实例
大数据·学习·数据分析
小王毕业啦20 小时前
2022年 国内税务年鉴PDF电子版Excel
大数据·人工智能·数据挖掘·数据分析·数据统计·年鉴·社科数据
坚持就完事了20 小时前
平滑技术(数据处理,持续更新...)
信息可视化·数据挖掘·数据分析
SelectDB1 天前
Apache Doris + MCP:Agent 时代的实时数据分析底座
大数据·数据分析·敏捷开发
XYu123011 天前
豆瓣图书评论数据分析与可视化
python·数据挖掘·数据分析