青岛科信软件 决策支持、数据挖掘方法
21.灰色系统关联度分析法
对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于第一,它们的理论基础不同。关联度分析基于灰色系统的灰色过程,而相关分析则基于概率论的随机过程;第二,分析方法不同。关联分析是进行因素间时间序列的比较,而相关分析是因素间数组的比较;第三,数据量要求不同。关联分析不要求数据太多,而相关分析则需有足够的数据量;第四,研究重点不同。关联度分析主要研究动态过程,而相关分析则以静态研究为主。 因此,关联度分析适应性更广,在用于社会经济系统中的应用更有其独到之处。 21.1原理与方法简介
关联度分析一般包括下列计算和步骤:(1) 原始数据变换;(2)
计算关联系数;(3) 求关联度;(3) 排关联序;(4) 列关联矩阵。在应用中是否进行所有步骤,可视具体情况而定。
设有m个时间序列
1
青岛科信软件 决策支持、数据挖掘方法
t12?(m)xn1亦即
xxx?(t)1(1)1(2)1xxx?(t)2(1)2(2)2?x?x?x??(t)n(1)n(2)n(m)x2(m)?xn
(0)(0){X1(0)(t)},{X2(t)},?,{Xm(t)} (t=1, 2, ?, N )
N为各序列的长度即数据个数,这m个序列代表m个因素(变量)。另设定时间序列:
{X0(0)(t)}
(t=1, 2, ?, N )
该时间序列称为母序列, 而上述m个时间序列称为子序列。关联度是两个序列关联性大小的度量。根据这一观点,可给关联度一个量化模型,其计算方法与步骤具体叙述如下:
1均值化变换。先分别求出各个序列的平均值,再用平均值去
除对应序列中的各个原始数据,所得到新的数据列。
2指标差值处理。在均值化变换后得到的新数据列
中,用第一列的数据分别与其他列数据相减取绝对值
3 计算关联系数
经数据变换的母数列记为{X0 (t)},子数列记为{Xi (t)},则在
t=k时母序列{X0 (k)}与子序列{Xi (k)}的关联系数L0i (k)可由下
2
青岛科信软件 决策支持、数据挖掘方法
L ( k ) ? 0i
?min ? ??
max ?0 i ( k ) ? ??max
式计算
,式中?0i (k)表示k时刻两比较序列的绝
对差, 即 ?0i (k)=?x0 (k)?xi (k)? (1 ? i ? m); ?max和?min分别表示所有比较序列各个时刻绝对差中的最大值与最小值。因为比较序列相交,故一般取?min=0;?称为分辨系数,其意义是削弱最大绝对差数值太大引起的失真,提高关联系数之间的差异显著性,??(0, 1),一般情况下可取0.1~0.5。本文取0.5。 分析结果
不难看出,关联度与下列因素有关: 1) 母序列X0不同,则关联度不同; 2) 子序列Xi 不同,则关联度不同;
3) 参考点0 (或数据变换)不同,关联度不同; 4) 数据序列长度N不同,关联度不同; 5) 分辨系数?不同,关联度不同。
一般来说,关联度也满足等价“关系”三公理,即: 1) 自反性: r00=1;2) 对称性: r0i =ri0;3) 传递性: r0a >r0b , r0b >r0c,则 r0a >r0c 。
(4) 排关联序
将m个子序列对同一母序列的关联度按大小顺序排列起来,
便组成关联序,记为{X}。它直接反映各个子序列对于母序列的“优劣”关系。若r0a >r0b ,则称{Xa }对于相同母序列{X0}有优于{Xb }的特点,记为{Xa|X0}?{Xb|X0};若
r0a 3 青岛科信软件 决策支持、数据挖掘方法 母序列{X0}劣于{Xb },记为{Xa|X0}?{Xb|X0};若 r0a=r0b,则称{Xa } 对于母序列{Xo }等价于(或等于){Xb },记为{Xa│X0}~{Xb│X0};若有r0a ?r0b,称{Xa }对于母序列{Xo }优于或等于{Xb },记为 {Xa|X0}?{Xb|X0}~;若有r0a ? r0b,则称{Xa }对于母序列{Xo }劣于或 {Xb|X0}等于{Xb },记为{Xa|X0}?。 ~ 根据上述几种关系,可定义两种有代表性的关联序,即“有 序”与“偏序”。若关联序{X}为有序,那么所有元素之间必存在以下几种关系之一:“优于”(?),“劣于” (?),或“等价于”(~)。若关联序{X}为偏序,则不是所有元素都可比较的。 一般而言,各因素只要能构成关系,算出关联度,则总是“有 序”的。只有在无“参考点”或无参考母序列的情况下,才可能出现“偏序”现象。 (5) 列出关联矩阵 若有n个母序列{Y1}, {Y2}, ?, {Yn } (n≠2)及其m个子序列 {X1}, {X2}, ?, {Xm } (m≠1),则各子序列对母序列{Y1}有关联度[r11, r12, ?, r1m ],各子序列对于母序列{Y2}有关联度[r21, r22, ?, r2m ],类似地,各子序列对于母序列{Yn }有关联度[rn1, rn2, ?, rnm ]。 将rij (i=1, 2, ?, n; j=1, 2, ?, m)作适当排列,可得到关联度 矩阵,根据关联度矩阵,不仅可以作为优势分析的基础,而且可作为决策的依据。若关联矩阵R中第i列满足 4 青岛科信软件 决策支持、数据挖掘方法 ?r1i??r??2i???????rmi??r1j??r?2j??????????rmj??(?i,j?1,2,?,n,i?j) 则称母序列{Yi }相对于其它母序列为最优,或者说从Y i 对于子序列Xj (j=1, 2, ?, m)的关联度来看,序列{Yi }是系统最优序列,并记为: ?Yi???Yj?(j?12,,?,n;j?i) 若有 1n1nr??ki?rkjnk?1nk?1(i,j?1,2,?,n;j?i) 则称母序列{Yi }相对于其余母序列,或相对于子序列{Xi } (i=1,2,?,m)的关联度是准最优的,并记为: {Yi}?{Yj}~ (j?{1, 2, ?, n}, j≠i) 若关联矩阵R为下三角矩阵,即: r1i r21 r31 ┆ rn1 r22 r32 ┆ rn2 r33 ┆ rn3 ? rnm 则称[Y1]相对于[Yi] (i?{2 , 3 , ?, n})是最优势的。 21.2灰色预测法 基于灰色建模理论的灰色预测法。 5