声明:以下笔记中的图片以及内容
均来自"数学建模学习交流"清风老师的课程资料,仅用作学习交流使用
文章目录
- 灰色关联分析
-
- 灰色关联法用于系统分析
-
- [第一步 excel画统计图](#第一步 excel画统计图)
- [第二步 确定分析序列](#第二步 确定分析序列)
- [第三步 对变量进行预处理](#第三步 对变量进行预处理)
- [第四步 计算子序列中各个指标与母序列的关联系数和灰色关联度](#第四步 计算子序列中各个指标与母序列的关联系数和灰色关联度)
- 灰色关联法用于综合评价
-
- [第一步 指标正向化](#第一步 指标正向化)
- [第二步 对正向化后的矩阵进行预处理](#第二步 对正向化后的矩阵进行预处理)
- [第三步 将预处理后的矩阵每一行取最大值构成母序列](#第三步 将预处理后的矩阵每一行取最大值构成母序列)
- [第四步 计算各个指标与母序列的灰色关联度](#第四步 计算各个指标与母序列的灰色关联度)
- [第五步 计算各个指标的权重](#第五步 计算各个指标的权重)
- [第六步 计算每个评价对象的得分](#第六步 计算每个评价对象的得分)
- [第七步 得分归一化](#第七步 得分归一化)
灰色关联分析
一般的抽象系统,如社会系统、经济系统、农业系统、生态系统、教育系统等都包含有许多种因素,多种因素共同作用的结果决定了该系统的发展态势。人们常常希望知道在众多的因素中,哪些是主要因素,哪些是次要因素;哪些因素对系统发展影响大,哪些因素对系统发展影响小;哪些因素对系统发展起推动作用需强化发展,哪些因素对系统发展起阻碍作用需加以抑制;......这些都是系统分析中人们普遍关心的问题。
传统数理统计中的回归分析 、方差分析 、主成分分析等都是用来进行系统分析的方法。这些方法都有下述不足之处:
- 要求有大量数据,数据量少就难以找出统计规律;
- 要求样本服从某个典型的概率分布 ,要求各因素数据与系统特征数据之
间呈线性关系且各因素之间彼此无关,这种要求往往难以满足; - 可能出现量化结果与定性分析结果不符的现象,导致系统的关系和规律
遭到歪曲和颠倒。
尤其是我国统计数据十分有限,而且现有数据灰度较大 ,再加上人为的原因,许多数据都出现几次大起大落,没有典型的分布规律。因此,采用数理统计方法往往难以奏效。
灰色关联分析方法弥补了采用数理统计方法作系统分析所导致的缺憾。它对
样本量的多少和样本有无规律 都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。
灰色关联分析的基本思想 是根据序列曲线几何形状的相似程度来判断其联系是否紧密 。曲线越接近,相应序列之间的关联度就越大,反之就越小。
对一个抽象的系统或现象进行分析,首先要选准反映系统行为特征的数据序
列,称为找系统行为的映射量,用映射量来间接地表征系统行为。例如,用国民平均接受教育的年数来反映教育发达程度,用刑事案件的发案率来反映社会治安面貌和社会秩序,用医院挂号次数来反映国民的健康水平等。有了系统行为特征数据和相关因素的数据,即可作出各个序列的图形,从直观上进行分析。
[参考:刘思峰.灰色系统理论及其应用(第五版)[M].北京:科学出版社, 2010: 62.]
注意:美赛别用 ,因为跟"灰色"有关的分析方法基本都是国内提出的分析方法,国外基本没人研究,美赛最好用传统的分析方法
一般情况下,n大用传统分析,n小用灰色关联
灰色关联法用于系统分析
例题
n个样本,m个指标
第一步 excel画统计图
- 四个变量均呈现上升趋势
- 第二产业的增幅较为明显
- 第二产业与第三产业的差距在后三年相差更大
第二步 确定分析序列
- 母序列(又称参考序列、 母指标):能反映系统行为特征的数据序列,类似于因变量y,此处记为 x 0 x_0 x0
- 子序列(又称比较序列、子指标):影响系统行为的因素组成的数据序列,蕾西与自变量x,此处记为 ( x 1 , x 2 , . . . , x m ) (x_1,x_2,...,x_m) (x1,x2,...,xm)
本例中,国内生产总值是 x 0 x_0 x0,第一、二、三产业分别是 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3.
第三步 对变量进行预处理
即去量纲,以便缩小范围简化计算
z i j ~ = x i j 1 n ∑ i = 1 n x i j \tilde{z_{ij}}=\frac{x_{ij}}{\frac{1}{n}\sum_{i=1}^{n}{x_{ij}}} zij~=n1∑i=1nxijxij
即每个数除以其所在指标下每个元素的均值
第四步 计算子序列中各个指标与母序列的关联系数和灰色关联度
母序列:
x 0 = ( x 0 ( 1 ) , x 0 ( 2 ) , . . . , x 0 ( n ) ) T x_0=(x_0(1),x_0(2),...,x_0(n))^{T} x0=(x0(1),x0(2),...,x0(n))T
子序列:
x 1 = ( x 1 ( 1 ) , x 1 ( 2 ) , . . . , x 1 ( n ) ) T x_1=(x_1(1),x_1(2),...,x_1(n))^{T} x1=(x1(1),x1(2),...,x1(n))T
. . . ... ...
x m = ( x m ( 1 ) , x m ( 2 ) , . . . , x m ( n ) ) T x_m=(x_m(1),x_m(2),...,x_m(n))^{T} xm=(xm(1),xm(2),...,xm(n))T
记两极最小差 a = min min ∣ x 0 ( k ) − x i ( k ) ∣ a=\min\min|x_0(k)-x_i(k)| a=minmin∣x0(k)−xi(k)∣ , 两极最大差 b = max max ∣ x 0 ( k ) − x i ( k ) ∣ b=\max\max|x_0(k)-x_i(k)| b=maxmax∣x0(k)−xi(k)∣
定义灰色关联系数 γ ( x 0 ( k ) , x i ( k ) ) = a + ρ b ∣ x 0 ( k ) − x i ( k ) ∣ + ρ b \gamma(x_0(k),x_i(k))=\frac{a+\rho b}{|x_0(k)-x_i(k)|+\rho b} γ(x0(k),xi(k))=∣x0(k)−xi(k)∣+ρba+ρb
ρ \rho ρ为分辨系数(一般取0.5)
定义灰色关联度 γ ( x 0 , x i ) = 1 n ∑ k = 1 n γ ( ( x 0 ( k ) , x i ( k ) ) \gamma(x_0,x_i)=\frac{1}{n}\sum_{k=1}^{n}\gamma((x_0(k),x_i(k)) γ(x0,xi)=n1∑k=1nγ((x0(k),xi(k))
即就是灰色关联度的算术平均数
灰色关联度与影响成正相关,则排序对比可得,该地区在2000年至2005年间的国内生产总值受到第三产业的影响最大。
灰色关联法用于综合评价
例题:评价下表中20条河流的水质情况
在综合评价中最大的问题是没有一个母序列,故需要我们构造一个母序列
(但实际上灰色关联用于综合评价的这种方法实际上有待商榷 最好是用topsis)
第一步 指标正向化
第二步 对正向化后的矩阵进行预处理
同上个例题 得到矩阵 Z n × m = ( z i j ) n × m Z_{n\times m}=(z_{ij})_{n\times m} Zn×m=(zij)n×m
第三步 将预处理后的矩阵每一行取最大值构成母序列
第四步 计算各个指标与母序列的灰色关联度
γ 1 , γ 2 , . . . , γ m \gamma_{1},\gamma_{2},...,\gamma_{m} γ1,γ2,...,γm
第五步 计算各个指标的权重
ω i = γ i γ 1 + γ 2 + . . . . + γ m \omega_i=\frac{ \gamma_i}{\gamma_1+\gamma_2+....+\gamma_m} ωi=γ1+γ2+....+γmγi
第六步 计算每个评价对象的得分
S k = ∑ i = 1 m Z k i ω i , k = ( 1 , 2 , . . . , n ) S_k=\sum_{i=1}^{m}{}Z_{ki} {\omega_i} , k=(1,2,...,n) Sk=∑i=1mZkiωi,k=(1,2,...,n)
第七步 得分归一化
S i ~ = S i S 1 + S 2 + . . . + S n \tilde{S_i}=\frac{S_i}{S_1+S_2+...+S_n} Si~=S1+S2+...+SnSi