关联度分析

2019-04-15 23:57

青岛科信软件 决策支持、数据挖掘方法

21.灰色系统关联度分析法

对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于第一,它们的理论基础不同。关联度分析基于灰色系统的灰色过程,而相关分析则基于概率论的随机过程;第二,分析方法不同。关联分析是进行因素间时间序列的比较,而相关分析是因素间数组的比较;第三,数据量要求不同。关联分析不要求数据太多,而相关分析则需有足够的数据量;第四,研究重点不同。关联度分析主要研究动态过程,而相关分析则以静态研究为主。 因此,关联度分析适应性更广,在用于社会经济系统中的应用更有其独到之处。 21.1原理与方法简介

关联度分析一般包括下列计算和步骤:(1) 原始数据变换;(2)

计算关联系数;(3) 求关联度;(3) 排关联序;(4) 列关联矩阵。在应用中是否进行所有步骤,可视具体情况而定。

设有m个时间序列

1

青岛科信软件 决策支持、数据挖掘方法

t12?(m)xn1亦即

xxx?(t)1(1)1(2)1xxx?(t)2(1)2(2)2?x?x?x??(t)n(1)n(2)n(m)x2(m)?xn

(0)(0){X1(0)(t)},{X2(t)},?,{Xm(t)} (t=1, 2, ?, N )

N为各序列的长度即数据个数,这m个序列代表m个因素(变量)。另设定时间序列:

{X0(0)(t)}

(t=1, 2, ?, N )

该时间序列称为母序列, 而上述m个时间序列称为子序列。关联度是两个序列关联性大小的度量。根据这一观点,可给关联度一个量化模型,其计算方法与步骤具体叙述如下:

1均值化变换。先分别求出各个序列的平均值,再用平均值去

除对应序列中的各个原始数据,所得到新的数据列。

2指标差值处理。在均值化变换后得到的新数据列

中,用第一列的数据分别与其他列数据相减取绝对值

3 计算关联系数

经数据变换的母数列记为{X0 (t)},子数列记为{Xi (t)},则在

t=k时母序列{X0 (k)}与子序列{Xi (k)}的关联系数L0i (k)可由下

2

青岛科信软件 决策支持、数据挖掘方法

L ( k ) ? 0i

?min ? ??

max ?0 i ( k ) ? ??max

式计算

,式中?0i (k)表示k时刻两比较序列的绝

对差, 即 ?0i (k)=?x0 (k)?xi (k)? (1 ? i ? m); ?max和?min分别表示所有比较序列各个时刻绝对差中的最大值与最小值。因为比较序列相交,故一般取?min=0;?称为分辨系数,其意义是削弱最大绝对差数值太大引起的失真,提高关联系数之间的差异显著性,??(0, 1),一般情况下可取0.1~0.5。本文取0.5。 分析结果

不难看出,关联度与下列因素有关: 1) 母序列X0不同,则关联度不同; 2) 子序列Xi 不同,则关联度不同;

3) 参考点0 (或数据变换)不同,关联度不同; 4) 数据序列长度N不同,关联度不同; 5) 分辨系数?不同,关联度不同。

一般来说,关联度也满足等价“关系”三公理,即: 1) 自反性: r00=1;2) 对称性: r0i =ri0;3) 传递性: r0a >r0b , r0b >r0c,则 r0a >r0c 。

(4) 排关联序

将m个子序列对同一母序列的关联度按大小顺序排列起来,

便组成关联序,记为{X}。它直接反映各个子序列对于母序列的“优劣”关系。若r0a >r0b ,则称{Xa }对于相同母序列{X0}有优于{Xb }的特点,记为{Xa|X0}?{Xb|X0};若

r0a

3

青岛科信软件 决策支持、数据挖掘方法

母序列{X0}劣于{Xb },记为{Xa|X0}?{Xb|X0};若

r0a=r0b,则称{Xa }

对于母序列{Xo }等价于(或等于){Xb },记为{Xa│X0}~{Xb│X0};若有r0a ?r0b,称{Xa }对于母序列{Xo }优于或等于{Xb },记为

{Xa|X0}?{Xb|X0}~;若有r0a ? r0b,则称{Xa }对于母序列{Xo }劣于或

{Xb|X0}等于{Xb },记为{Xa|X0}?。 ~ 根据上述几种关系,可定义两种有代表性的关联序,即“有

序”与“偏序”。若关联序{X}为有序,那么所有元素之间必存在以下几种关系之一:“优于”(?),“劣于” (?),或“等价于”(~)。若关联序{X}为偏序,则不是所有元素都可比较的。

一般而言,各因素只要能构成关系,算出关联度,则总是“有

序”的。只有在无“参考点”或无参考母序列的情况下,才可能出现“偏序”现象。

(5) 列出关联矩阵

若有n个母序列{Y1}, {Y2}, ?, {Yn } (n≠2)及其m个子序列

{X1}, {X2}, ?, {Xm } (m≠1),则各子序列对母序列{Y1}有关联度[r11, r12, ?, r1m ],各子序列对于母序列{Y2}有关联度[r21, r22, ?, r2m ],类似地,各子序列对于母序列{Yn }有关联度[rn1, rn2, ?, rnm ]。

将rij (i=1, 2, ?, n; j=1, 2, ?, m)作适当排列,可得到关联度

矩阵,根据关联度矩阵,不仅可以作为优势分析的基础,而且可作为决策的依据。若关联矩阵R中第i列满足

4

青岛科信软件 决策支持、数据挖掘方法

?r1i??r??2i???????rmi??r1j??r?2j??????????rmj??(?i,j?1,2,?,n,i?j)

则称母序列{Yi }相对于其它母序列为最优,或者说从Y i 对于子序列Xj (j=1, 2, ?, m)的关联度来看,序列{Yi }是系统最优序列,并记为:

?Yi???Yj?(j?12,,?,n;j?i)

若有

1n1nr??ki?rkjnk?1nk?1(i,j?1,2,?,n;j?i)

则称母序列{Yi }相对于其余母序列,或相对于子序列{Xi } (i=1,2,?,m)的关联度是准最优的,并记为:

{Yi}?{Yj}~ (j?{1, 2, ?, n}, j≠i)

若关联矩阵R为下三角矩阵,即:

r1i r21 r31 ┆ rn1

r22 r32 ┆ rn2

r33 ┆ rn3

? rnm

则称[Y1]相对于[Yi] (i?{2 , 3 , ?, n})是最优势的。 21.2灰色预测法

基于灰色建模理论的灰色预测法。

5


关联度分析.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:java软件开发——顶岗实习周记25篇

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: