5 6 7 8 9 10 11 0.1640 -0.2654 -0.0768 0.0144 0.4409 0.4813 -0.4173 -0.0233 0.5122 0.1891 -0.3248 0.4558 -0.0075 0.1223 -0.0179 -0.0411 -0.3317 -0.1567 -0.1574 0.2345 0.6774 -0.3379 0.4827 0.2333 0.0767 0.1030 0.2786 -0.1347 -0.6483 -0.2919 0.0738 0.2092 0.2607 0.0302 0.0955 注:竖列的1,2?,11表示标准化后的11个数据,即x1,…,x11。 由此得到五个主成分:
y1?0.3775x1?0.2237x2?????0.4173x11
y2?0.3566x1?0.0496x2?????0.1223x11 y3?0.3763x1?0.2021x2?????0.6774x11
y4??0.1293x1?0.4985x2?????0.1347x11
y5??0.2234x1?0.0598x2?????0.0955x11
从主成分的系数可以看出,第一主成分主要反映了人均GDP、人口密度、高等院校入学率、人均耕地面积的信息;第二主成分主要反映了人均GDP、每千美元的能源消耗量、CO2排放量、人口增长、人口密度;第三主成分主要反映了人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率、人均耕地面积;第四主成分主要反映了城镇人口比重、每千美元的能源消耗量、颗粒污染程度、CO2排放量;第五主成分主要反映了人均能源使用量和颗粒污染程度。综上可以看出人均GDP、每千美元的能源消耗量、五岁以下婴儿死亡率的影响相对较大一些。把各节点的原始11个指标的标准化数据代入五个主成分的表达式,就可以得到各地区的五个主成分值。
分别以五个主成分的贡献率为权重,构建主成分综合评价模型:
Z?0.4747y1?0.2000y2?0.1152y3?0.0670y4?0.0635y5 (1)
把各节点的五个主成分值代入式(1),可以得到各地区高教发展水平的综合评价值以及排序结果如表4
表4 2000年的21个国家和世界的健康指数 节点 USA AUS CAN NZL RUS JPN 排名 1 2 3 4 5 6 Z 2.054 2.039 1.968 0.724 0.539 0.529 节点 GBR FRA DEU ISR SAU ITA 排名 7 8 9 10 11 12 Z 0.495 0.429 0.418 0.291 0.195 0.075 节点 ARG KAZ ZAF BRA IRN WLD 排名 13 14 15 16 17 18 -0.075 -0.094 -0.558 -0.788 -0.85685 -1.11022 MAR EGY CHN KEN 19 20 21 22 -1.34431 -1.48728 -1.49224 -1.94967 注:上述的USA等为各节点的缩写。
由表4以及附录中表5的数据可以看出美国、澳大利亚、加拿大的健康指数在20年内都很高,说明这几个国家的健康状况较好;Morocco、Egypt Arab Rep. China、Kenya等国家的健康指数在20年后都很低,说明这几个国家的健康状况较差。同时可以世界平均水平的健康指数也较低,说明地球面临严峻的健康问题。运用同样的方法,可以求出1991-2010的各节点的综合评价,所得的综合值Z进行如下标准化:
Z 节点 排名 Z Zij?Zij?ZijSij,(i?1,2,???,22;j?1,2???,20)
标准化后的1991-2010年的21个国家和世界的健康指数见附录。
5.3有向复杂网络模型的建立与求解
针对上文已经得到的21个国家的生态健康指数值,考虑在同一个地球生物圈内各国的生态健康是相互作用的,不能独立于周边的国家的影响,而且随着全球化进程的不断加快,全球间的各个国家势必会联系越来越频繁。我们在考虑地球生态健康的时候,将各个国家看成一个个节点,不同节点由网络边连接起来,构成整体的生态系统网络。在整个生态系统大网络中各个节点间是否作用,或作用的强弱程度我们是通过对选取节点的健康值进行逐步回归得到的。
本文运用逐步回归来分析来确定有向复杂网络的边和对应权重。由于涉及国家数目过多,根据地理特性分别在各大洲共选取8个国家:澳大利亚、巴西、中国、日本、俄罗斯联邦、南非、英国、美国。依次将其中一个国家的生态健康值当做y值,其余各国指标为x值来进行逐步回归观察各国家节点在网络中是否关联及相应权重。 5.3.1 逐步回归
逐步回归的基本思想是:对全部因子按其对y影响程度大小(偏回归平方的大小),从大到小地依次逐个地引入回归方程,并随时对回归方程当时所含的全部变量进行检验,看其是否仍然显著,如不显著就将其剔除,知道回归方程中所含的所有变量对y的作用都显著是,才考虑引入新的变量。再在剩下的未选因子中,选出对y作用最大者,检验其显著性,显著着,引入方程,不显著,则不引入。直到最后再没有显著因子可以引入,也没有不显著的变量需要剔除为止。逐步回归分析时在考虑的全部自变量中按其对y的贡献程度大小,由大到小地逐个引入回归方程,而对那些对y作用不显著的变量可能是中不被引入回归方程。另外,已被引入回归方程的变量在引入新变量进行F检验后失去重要性时,需要从回归方程中剔除出去。
逐步回归算法步骤: Step 1 计算变量均值:
x1,x2,,xn,y
差平方和:
L11,L22,记各自的标准化变量为:
,Lpp,Lyy.
uj?xj?xjLjj,j?1,,p,up?1?(0)y?y.Lyy
Step 2 计算
x1,x2,,xp,y的相关系数矩阵R。
Step 3 设已经选上了K个变量:
xi1,xi2,且
,xik,
i1,i2,,ik互不相同,R(0)经过变换后为:
R(k)?(ri(jk)).对j?1,2,
,k逐一计算标准化变量uij的偏回归平方和:
Vi(jk)?记:
)2(ri(jk,(p?1))ri(jikj)
Vl(k)?max{Vij(k)}作F检验:
Vl(k)F?(k)r(p?1)(p?1)(n?k?1)对给定的显著性水平?,拒绝域为:
F?F1??(1,n?k?1)。
Step 4 转到Step 3 循环,直至最终选上了t个变量
xi1,xi2,,xit,且
i1,i2,,it互不相同,
R(0)经过变换后为:
R(t)?(ri(jt))则对应的回归方程为:
xi1?xi1??yyk)?ri1(,(?p?1)LyyLi1i1通过代数运算可得:
)?rik(k,(p?1)xik?xikLikik,
??b0?bi1xi1?y?bikxik。
逐步回归是用Matlab统计工具箱中的命令stepwise,它提供了一个交互式画面,通过这个工具你可以自由地选择变量,进行统计分析,其方法通常为:
stepwise(x,y,inmodel,alpha)
其中x是自变量数据,y是因变量数据,分别为 n×m和 n×1矩阵,inmodel是矩阵x的列数的指标,给出初始模型中包括的子集(缺省时设定为空),alpha为显著性水平。Stepwise Regression 窗口,显示回归系数及其置信区间,和其它一些统计量的信息。绿色表明在模型中的变量,红色表明从模型中移去的变量。在这个窗口中有Export按钮,点击Export产生一个菜单,表明了要传送给Matlab工作区的参数,它们给出了统计计算的一些结果。 下面以美国的指标为y值,其他国家的指标为x值进行逐步回归的结果:
??0.51183?0.4606x2?0.4921x3?0.5677x4?0.191x5,由此认为美国和巴西,中y国,日本,俄罗斯之间的节点存在边,各边权重分别为-0.4606,-0.4921,0.5677,0.191.具体运算界面见图1
Coefficients with Error BarsX1X2X3X4X5X6X7-1-0.500.5 Coeff. t-stat p-val -0.123067 -1.6807 0.1150 -0.460568 -2.0084 0.0630 -0.492149 -8.1699 0.0000 0.567744 5.1639 0.0001 0.191025 2.1229 0.0508 -0.141384 -1.7230 0.1069 0.190676 1.4923 0.1578Model History0.028RMSE0.0270.0260.0251234 图1 逐步回归结果图(USA)
同样方法可以得到其他各国节点在网络中的边和权重。各国数据如表6
表 6网络中国家节点边和权重 USA AUS BRA CHN JPN RUS ZAF GBR USA 0 AUS 0 BRA 0 0 0 0 0 CHN 0 0.8548 0.2168 JPN 0 0.718 RUS 0.191 0 0.3529 ZAF 0 0 GBR 0 0 0.6933 0 常数项 0.5118 -0.4133 0.2677 2.133 -0.6103 -0.4606 -0.4921 0.5677 -0.3407 0.3206 -0.7831 0 -0.5625 2.3883 -0.4973 0 -0.6625 0 0.7807 0 0 0 0 0 -0.11 -0.6411 -0.8937 -0.4951 0.3652 -0.5061 0.4372 0.2597 0 -0.4953 0 -0.6611 -0.9761 0.4575 -0.6519 0.364 -1.3095 -1.5355 -0.4864
经过matlab运算后的逐步回归结果整理后得到有向复杂网络图如图2,其中各节点的作用的方向和作用权重如图:
-0.6519-0.9761United States-0.6625-0.4921-0.6411China0.21680.35290.71800.2597South Africa-0.4864-1.30950.36520.5677-0.4973-0.46060.1910-0.34070.8548Russian Federation0.4575-0.89370.7807-0.7831Britain0.6933-0.11000.4372-0.4953-0.50610.3206Brazil-0.6611-0.5625Australia0.4864Japan图2 八国家的复杂网络图及权重
5.3.2有向复杂网络模型计算分析
随着复杂网络研究的不断深入,在原有的基于无权网络的ER随机图模型、WS小世界模型和无标度网络模型BA模型基础上,文献[9]给出了一个由边和节点权值驱动网络动态演化的BBV模型。所谓的BBV网络模型[6,7]是2004年Barrat Barthelemy和vesPignani提出的一个无向加权的网络演化模型。
首先定义一个有向加权网络:设图DWG=(V,E)表示一个复杂网络。其中V表示节点集,E表示边集。总节点数一记为N,边数记为M, N?V,M?E。E中每条边都有V中的一对点与之相对应。任意两点i和j对应的边(i,j)和(j,i)不同。 入强度:
Sii?出强度:
j?J'(i)?aijwij
Si0??jViajiwji
?()其中所有Vi的所有邻接点Aij表示i和j之间有连接的边,且边的指向性是节点i指向
节点j。
有向复杂网络的平均最短路径长度:
dij?wik?wki
平均距离定义: L(i)?1?dn?1j?iij
实际中网络的平均最短距离: