由上表结合碎石图以及载荷图可以看出,第1主成分的贡献率为83.8%,已能较好地反映6个一致指标的总体变动情况,而且根据它的特征值可以发现第2个特征值开始明显变小,碎石图在第二主成分处左右出现明显的拐弯,表中已经给出对应的特征向量,且累计贡献率大于95%,因此选取第一和第二主成分,设为Z1、Z2两大类主成分
选取各成分(变量)对主成分贡献率大于0.23的变量为主成分的组合成分,则两大主成分的表达式为:
PC1=0.425X1+0.423X2+0.432X3+0.424X4+0.323X5+0.411X6 PC2=-0.342X1+0.100X2-0.229X3-0.357X4-+0.800X5+0.231X6
对变量进行标准化处理
键入命令:GENR y1=(y-@mean(y))/@stdev(y),其余X也采用同样的方法。
得到相应的Y1 X11 X22 X33 X44 X55 X66
对标准化变量进行回归得到模型:
Y1??0.955X11-0.221X22?1.151X33?0.864X44-0.050X55?0.095X66
Z1 Z2的表达式如下:
Genr Z1=0.425*x11+0.423*x22+0.432*x33+0.424*x44+0.323*X55+0.411*X66 Genr Z2=-0.342*X11+0.1*x22-0.229*x33-0.357*x44+0.8*X55+0.231*X66
得到的数据信息如下
对新生成的主成分Z1和Z2进行相关性分析如下表:
从上表可看出,经过将六个变量整合为Z1和Z2两个主成分后,两者之间不再有明显的相关性,因此可认为该操作消除了变量之间的共线性
第一大主成分Z1由旅游接待天数X1、人均天消费额X2、人均
可支配收入X3、旅游者人数X4、公路里程X6构成,且每一类的贡
献率都在0.4左右,所以Z1几乎是这五项的等权平均,因此可以将他看成是旅游消费收入的直接影响因素
第二大主成分Z2的主要成分是旅游饭店x5,贡献率达到0.8,且他与其他成分的相关性不高,因此可以把它看成是旅游消费收入的间接影响因素
对主成分进行最小二乘估计,得出结果:
其中,修正可决系数为0.959542,整体拟合状况良好。pc1和pc2的p值均为0,表明这两个因素对y有显著影响。
5.求解标准化回归系数:
由于y 和x 都是标准化变量,所以标准化回归系数
?i?c1v1j?c2v2j=116.3136v1j-85.9048v2j(i=1,2,…,6)其中c1,c2为主成分与变量y回归后的系数,v1j,v2j为原6个变量表示前两个主成分时的系数。 最终模型中的系数bi=
SY?i,bi即为利用主成分消除共线性后,Si原变量在最终模型中的系数。SY、Si分别为Y 和Xi的标准差。 首先,将Y、X1~X6 作为数组打开, 在窗口菜单上选择Descriptive Stats \\ Common Sample,
得到各变量的均值和标准差,如下:
计算过程可以在Excel表中进行操作操作如下:
其中,?0=Y-??iXi
最终模型为:
y?-1075099.433?0.00014X1?31.74X2?0.6915X3?0.00289X4?1.073X5?0.0074X6