SPSS上机实验报告

2020-05-05 17:17

四川理工学院

SPSS上机实验报告

课程名称:SPSS统计分析高级教程

专业班级:2012级统计2班

姓 名:雷鹏程

学 号:12071050109

指导教师:林旭东 实验日期: 2014年12月24日

实验名称:主成分分析、因子分析

一、实验案例

现希望根据全国30个省、市、自治区经济发展基本情况的8项指标对其进行分析与排序。具体指标有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业生产总值,具体的数据见文件factor1.sav。

二、实验预分析

本案例中的指标较多,所以首先想到的是看看各个指标见的相关系数矩阵,然后对其进行主成分分析。由于还要进行对各个省、市、自治区进行排序,所以利用因子分析计算出各个省、市、自治区综合得分,得到最后的实验结论。

三、实验目的

3.1、掌握利用SPSS进行主成分、因子分析。 3.2、解释运行结果。 3.3、得出最终的实验结论

四、实验操作步骤和结果描述

4.1初步分析:

(1)选择“(3)在“

(4)点击“ok”。 得到如下表1、2、3:

Correlation Matrix ”→“

”对话框中选择“

” →“”列表框。

”菜单项。

”,点击“

”。

(2)将8个指标x1~x8选人“

GDP 1.000 .267 .951 .187 .617 -.273 -.264 .874 居民消费水平 .267 1.000 .426 .716 -.151 -.235 -.593 .363 固定资产投资 .951 .426 1.000 .396 .431 -.280 -.359 .792 职工平均货物周转居民消费价商品价格工业总产工资 .187 .716 .396 1.000 -.357 -.145 -.543 .099 量 .617 -.151 .431 -.357 1.000 -.253 .022 .659 格指数 -.273 -.235 -.280 -.145 -.253 1.000 .763 -.125 指数 -.264 -.593 -.359 -.543 .022 .763 1.000 -.192 值 .874 .363 .792 .099 .659 -.125 -.192 1.000 CorrelatiGDP on 居民消费水平 固定资产投资 职工平均工资 货物周转量 居民消费价格指数 商品价格指数 工业总产值 表1各个指标间的相关系数矩阵

Total Variance Explained Component 1 2 3 4 5 6 7 8 Total 3.754 2.203 1.208 .403 .214 .138 .066 .015 Initial Eigenvalues % of Variance 46.924 27.532 15.096 5.042 2.673 1.722 .829 .183 Cumulative % 46.924 74.456 89.551 94.593 97.266 98.988 99.817 100.000 Extraction Sums of Squared Loadings Total 3.754 2.203 1.208 % of Variance 46.924 27.532 15.096 Cumulative % 46.924 74.456 89.551 a Extraction Method: Principal Component Analysis. 表2解释的总方差 Component Matrix GDP 居民消费水平 固定资产投资 职工平均工资 货物周转量 居民消费价格指数 商品价格指数 工业总产值 1 .884 .606 .911 .465 .486 -.510 -.621 .822 Component 2 .385 -.596 .163 -.725 .737 .257 .596 .429 3 .120 .277 .213 .362 -.279 .794 .433 .210 Extraction Method: Principal Component Analysis. a. 3 components extracted. 表3主成分矩阵

结果解释:由表1相关系数表可得,可见许多变量之间直接的相关性较强,的确存在信息上的重叠,说明有信息浓缩的必要性。表2可得的是各个成分的方差贡献率和累计贡献率,可见只有前3个主成分的特征根大于1,并且前三个主成分的累计方差贡献率达到89.55%,因此选前三个主成分就能足够描述经济的发展水平。由表3知道第一个主成分主可以看成是反映GDP、固定资产投资、居民消费水平和工业总产值的综合指标,第二个主成分看成是反映平均工资和货物周转量方面的综合指标,第三个主成分看成反映居民消费价格指数的综合指标。显然这个并没有解释出排序结果,所以下面继续进行因子分析后的综合排序。 4.2进阶分析:

(1)在“(2)在“(3)在“(5)在“

(6)点击“ok”。

”对话框中选择“”对话框中选择“”对话框中选择“”对话框中勾选“

”。 ”。

”。

”。

得到下表4、5、6、7:

KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .620 231.285 28 .000 表4 KMO和Bartlett检验表 Total Variance Explained Extraction Sums of Squared Component 1 2 3 4 5 6 7 8 Total 3.754 2.203 1.208 .403 .214 .138 .066 .015 Initial Eigenvalues % of Variance 46.924 27.532 15.096 5.042 2.673 1.722 .829 .183 Cumulative % 46.924 74.456 89.551 94.593 97.266 98.988 99.817 100.000 Total 3.754 2.203 1.208 Loadings % of Variance 46.924 27.532 15.096 Cumulative % 46.924 74.456 89.551 Total 3.207 2.217 1.740 Rotation Sums of Squared Loadings % of Variance 40.092 27.708 21.752 Cumulative % 40.092 67.800 89.551 Extraction Method: Principal Component Analysis. 表5解释的总方差表

Component Matrix a GDP 居民消费水平 固定资产投资 职工平均工资 1 .884 .606 .911 .465 Component 2 .385 -.596 .163 -.725 3 .120 .277 .213 .362 货物周转量 居民消费价格指数 商品价格指数 工业总产值 .486 -.510 -.621 .822 .737 .257 .596 .429 -.279 .794 .433 .210 Undefined error #11401 - Cannot open text file \a. 3 components extracted. a表6 旋转前成分矩阵 Rotated Component Matrix Component GDP 居民消费水平 固定资产投资 职工平均工资 货物周转量 居民消费价格指数 商品价格指数 工业总产值 1 .955 .219 .872 .048 .751 -.135 -.104 .944 2 .124 .841 .351 .925 -.507 -.013 -.496 .109 3 -.131 -.209 -.137 -.121 -.192 .969 .819 -.014 Undefined error #11401 - Cannot open text file \ Undefined error #11408 - Cannot open text file \a. Rotation converged in 5 iterations. 表7 旋转后成分矩阵

图1 碎石图

结果解释:由表4可得KMO的值为0.62,并且Bartlett检验显著,说明可以做因子分析,由表5可得前三个主成分在旋转过后的3个公因子的方差贡献率均发生了变化,彼此的差距有所缩小,但是其方差贡献率仍然是89.55%,表6表7看出在旋转过后主成分更好的表示出来,由碎石图可以得到可以提取前3个主成分。

由于上述3个公因子分别从不同的方面反映当地经济发展状况的总体水平,利用各个因子对应的方差贡献率比例为权数计算出综合得分,计算的方程如下: Socer=40.09/89.55*FAC1-1+27.71/89.55*FAC2-1+21.75/89.55*FAC3-1 计算出综合因子得分socer,得分前5个地区如下表8所示: 序号 8 9 15 19 22 地区 上海 江苏 山东 广州 四川 FAC1-1 0.615 2.034 2.117 1.485 1.107 FAC2-1 3.662 0.271 -0.194 1.684 -0.520 FAC3-1 0.847 -0.171 0.252 -1.182 0.520 Socer 1.61 0.95 0.95 0.90 0.57 表8 综合排序的前5位地区

可见上海的综合得分最高,其消费因子表现的最为突出,排名第二三是江苏与山东;广东虽然总量因子和消费因子表现不错,但过高物价拉低了综合得分,但四川刚好与广东表现相反。上述的综合比较结果可以很好的解释各个地区的整个经济发展的有点与劣势。

五、 实验总结

本次实验通过对案例预分析后,选定了解决案例的模型,通过在实验中步步对模型的优化与检验,找到了案例的最优的结果,对案例的问题进行了回答与解释。并且在本次SPSS上机实验让我对这门软件有了较深刻的认识,SPSS是一款菜单式的软件,操作简便,易于理,利用将有助于提高工作效率。利用SPSS进行统计分析,变量和数据是必不可少的。数据输入后通常需要对数据进行进一步的处理,其中最有价值的是数据的预处理以及问题预处理。


SPSS上机实验报告.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:高中数学新课 立体几何 教案(10)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: