云南省旅游消费影响因素分析—主成分分析方法(2)

2019-06-10 23:26

由上表结合碎石图以及载荷图可以看出,第1主成分的贡献率为83.8%,已能较好地反映6个一致指标的总体变动情况,而且根据它的特征值可以发现第2个特征值开始明显变小,碎石图在第二主成分处左右出现明显的拐弯,表中已经给出对应的特征向量,且累计贡献率大于95%,因此选取第一和第二主成分,设为Z1、Z2两大类主成分

选取各成分(变量)对主成分贡献率大于0.23的变量为主成分的组合成分,则两大主成分的表达式为:

PC1=0.425X1+0.423X2+0.432X3+0.424X4+0.323X5+0.411X6 PC2=-0.342X1+0.100X2-0.229X3-0.357X4-+0.800X5+0.231X6

对变量进行标准化处理

键入命令:GENR y1=(y-@mean(y))/@stdev(y),其余X也采用同样的方法。

得到相应的Y1 X11 X22 X33 X44 X55 X66

对标准化变量进行回归得到模型:

Y1??0.955X11-0.221X22?1.151X33?0.864X44-0.050X55?0.095X66

Z1 Z2的表达式如下:

Genr Z1=0.425*x11+0.423*x22+0.432*x33+0.424*x44+0.323*X55+0.411*X66 Genr Z2=-0.342*X11+0.1*x22-0.229*x33-0.357*x44+0.8*X55+0.231*X66

得到的数据信息如下

对新生成的主成分Z1和Z2进行相关性分析如下表:

从上表可看出,经过将六个变量整合为Z1和Z2两个主成分后,两者之间不再有明显的相关性,因此可认为该操作消除了变量之间的共线性

第一大主成分Z1由旅游接待天数X1、人均天消费额X2、人均

可支配收入X3、旅游者人数X4、公路里程X6构成,且每一类的贡

献率都在0.4左右,所以Z1几乎是这五项的等权平均,因此可以将他看成是旅游消费收入的直接影响因素

第二大主成分Z2的主要成分是旅游饭店x5,贡献率达到0.8,且他与其他成分的相关性不高,因此可以把它看成是旅游消费收入的间接影响因素

对主成分进行最小二乘估计,得出结果:

其中,修正可决系数为0.959542,整体拟合状况良好。pc1和pc2的p值均为0,表明这两个因素对y有显著影响。

5.求解标准化回归系数:

由于y 和x 都是标准化变量,所以标准化回归系数

?i?c1v1j?c2v2j=116.3136v1j-85.9048v2j(i=1,2,…,6)其中c1,c2为主成分与变量y回归后的系数,v1j,v2j为原6个变量表示前两个主成分时的系数。 最终模型中的系数bi=

SY?i,bi即为利用主成分消除共线性后,Si原变量在最终模型中的系数。SY、Si分别为Y 和Xi的标准差。 首先,将Y、X1~X6 作为数组打开, 在窗口菜单上选择Descriptive Stats \\ Common Sample,

得到各变量的均值和标准差,如下:

计算过程可以在Excel表中进行操作操作如下:

其中,?0=Y-??iXi

最终模型为:

y?-1075099.433?0.00014X1?31.74X2?0.6915X3?0.00289X4?1.073X5?0.0074X6


云南省旅游消费影响因素分析—主成分分析方法(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:北邮场强仪实验报告

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: