gensim conherence model C_V 值与其他指标负相关BUG

在我用gensim3.8.3 conherence model分析京东评论主题模型时, C_V 与npmi、u_mass出现了强烈的皮尔逊负相关:

这些地方也反映了类似问题:

https://github.com/dice-group/Palmetto/issues/12

https://github.com/dice-group/Palmetto/issues/13

https://github.com/dice-group/Palmetto/issues/76

按道理来说,这些一致性评分都是越高越好。这里是怎么回事呢?

原来是原实现代码的gamma值搞错了,应该设置为1而不是2:

https://github.com/dice-group/Palmetto/issues/81

ps:截至2023.07.27,我电脑里的gensim版本还是3.8.1,没有更新到最新版的gensim(4.3.0),因此不知道gensim是否已修复此问题。肯折腾的朋友可以去尝试一下

相关推荐
!chen11 小时前
Oracle 19.20未知BUG导致oraagent进程内存泄漏
数据库·oracle·bug
阿什么名字不会重复呢20 小时前
在线工具+网页平台来学习和操作Python与Excel相关技能
python·数据分析
charlee441 天前
PandasAI连接LLM进行智能数据分析
ai·数据分析·llm·pandasai·deepseek
Re_Yang091 天前
数学专业转型数据分析竞争力发展报告
数据挖掘·数据分析
workflower1 天前
数据分析前景
算法·数据挖掘·数据分析·需求分析·软件需求
我要学习别拦我~1 天前
kaggle分析项目:steam付费游戏数据分析
python·游戏·数据分析
海哥编程2 天前
Python 数据分析(二):Matplotlib 绘图
python·数据分析·matplotlib
Watermelo6172 天前
极致的灵活度满足工程美学:用Vue Flow绘制一个完美流程图
前端·javascript·vue.js·数据挖掘·数据分析·流程图·数据可视化
Watermelo6172 天前
Web Worker:让前端飞起来的隐形引擎
前端·javascript·vue.js·数据挖掘·数据分析·node.js·es6
SickeyLee3 天前
BI 系统数据看板全解析:让数据可视化驱动业务决策
信息可视化·数据挖掘·数据分析