熵权法模型(评价类问题)

一. 概念

利用信息熵计算各个指标的权重,从而为多指标的评价类问题提供依据。

指标的变异程度越小,所反映的信息量也越少,所以其对应的权值也应该越低。

指标的变异程度(或称为变异性、波动性):描述了一个指标在不同观测值之间的差异程度或分散程度。简单来说,它反映了数据的分布宽度和离散情况。

也即如果一个指标的波动性越小,说明该指标对最终结果的影响理应越小,也即其对应权值更低。

信息熵公式:

  • :表示随机变量 的熵。熵衡量了随机变量的不确定性或信息量。熵越大,随机变量的不确定性越高。
  • :随机变量 的一种取值情况。
  • :随机变量 取值为 的概率。每个 都有一个与之对应的概率
  • 的二进制对数。对数的底数为 2,因此它表示的是以比特为单位的信息量。具体来说, 衡量了事件 发生时的信息量。

由于概率 总是介于 0 和 1 之间, 会是一个负数。负号保证了整个熵的值为正数。

这个公式通过对所有可能取值的信息量加权求和,衡量了随机变量 的不确定性。熵值越大,说明随机变量 的不确定性越高。

二. 特点

熵权法是一种客观的赋权方法,它可以靠数据本身得出权重,避免了主观因素的介入。

三. 实现步骤

1. 标准化

消除量纲的影响。将所有的指标转变为0到1之间的数。

相关推荐
视界先声12 分钟前
从步态分析到康复医学:青瞳视觉(CHINGMU)如何用高精度动捕解读人体“运动密码”
大数据
猴哥聊项目管理22 分钟前
2026年免费项目管理工具,支持任务分配+甘特图+协作 推荐
大数据·数据库·甘特图·项目管理工具·项目管理软件·免费项目管理软件·研发项目管理软件
Hello.Reader27 分钟前
Apache Flink 网络 Buffer 调优Debloating 的边界、Buffer 生命周期
大数据·flink·apache
Hello.Reader28 分钟前
Apache Flink 内存故障排查从 IllegalConfigurationException 到 OOMKilled,一篇把坑踩平的指南
大数据·flink·apache
好好沉淀35 分钟前
Elasticsearch (ES) 核心笔记
大数据·笔记·elasticsearch
瑞华丽PLM1 小时前
从设计到制造的“断裂带”:汽车零部件企业如何通过 eBOM 与 mBOM 的无缝转化降低成本?
大数据·人工智能·汽车·制造·国产plm·瑞华丽plm·瑞华丽
AllData公司负责人1 小时前
【亲测好用】实时开发IDE平台能力演示 原创
大数据·ide·开源·数据同步
王锋(oxwangfeng)1 小时前
Spark 向量化执行引擎技术选型与实践指南
大数据·分布式·spark
YangYang9YangYan1 小时前
2026大专大数据技术专业学习数据分析的必要性
大数据·学习·数据分析
dingzd951 小时前
亚马逊跨境电商近期规则变化与应对策略
大数据·市场营销·跨境电商·亚马逊