Zscore(全员劳动生产率) -.60570 1.37105 .61837 此表表示各个类在各个变量上的平均值。 ANOVA 聚类 误差 自由度 2 2 2 2 2 2 均方 .497 .505 .383 .269 .908 .493 自由度 27 27 27 27 27 27 F 15.679 15.199 24.337 40.432 2.476 15.936 显著性 .000 .000 .000 .000 .103 .000 Zscore(企业个数) Zscore(盈利个数) Zscore(净利润) Zscore(营业收入) Zscore(增加值率) Zscore(全员劳动生产率) 均方 7.791 7.679 9.327 10.870 2.247 7.850 由此表的显著性一栏中可以看出,各类之间的差异都是显著的(接近于0),表示将30个地区分为三类是合理的。这已证明了上个实验的结论是相对可靠的。 三.主成分分析: 1.实验内容:用spss对2015-2016赛季NBA常规赛50位球员进行主成分分析,并从数据中得出一些相关统计结果。 2. 实验目的: 掌握主分析的基本思想,并能够对分析结果进行解释。 3. 实验环境 SPSS软件。 4. 实验过程: 1、数据采集,选取2015-2016赛季现役50位球员常规赛的各项指标,包括出场时间、得分、篮板、助攻、抢断、盖帽、失误、犯规、投篮命中率、罚球命中率和效率值11项指标。
第6页 共14页
2、对表中数据选取适当的指标做主成分分析。对以上数据进行主成分分析,选择变量为得分、篮板、助攻、抢断、盖帽、失误、投篮命中率、罚球命中率和效率值9个变量。 相关性矩阵 相关得分 性 篮板 助攻 抢断 盖帽 失误 投篮命中率 罚球命中率 效率值 公因子方差 初始 提取 得分 篮板 助攻 抢断 盖帽 投篮命失误 中率 -.181 .674 -.363 -.276 .675 -.328 1.000 -.629 .301 罚球命中率 .310 -.594 .295 .217 -.385 .215 -.629 1.000 效率值 .684 .509 .262 .400 .225 .456 .301 -.071 1.000 -.023 .171 .370 -.198 .523 -.023 1.000 -.405 -.163 .739 -.125 .171 -.405 1.000 .591 -.580 .672 .370 -.163 .591 1.000 -.398 .592 -.198 .739 -.580 -.398 1.000 -.370 .523 -.125 .672 .592 -.370 1.000 -.181 .310 .684 .674 -.594 .509 -.363 .295 .262 -.276 .217 .400 .675 -.385 .225 -.328 .215 .456 -.071 1.000 得分 1.000 .882 篮板 1.000 .864 助攻 1.000 .835 抢断 1.000 .687 盖帽 1.000 .783 失误 1.000 .765 投篮命中1.000 .783 率 罚球命中1.000 .777 率 效率值 1.000 .937 提取方法:主成分分析法。 总方差解释 初始特征值 方差百累总计 分比 积 % 3.843 2.468 1.003 .498 .429 .386 42.697 27.425 11.144 5.534 4.772 4.284 提取载荷平方和 方差百累总计 分比 积 % 旋转载荷平方和 方差百累总计 分比 积 % 32.792 32.792 27.441 60.233 21.034 81.267 成分 1 2 3 4 5 6 42.697 3.843 70.123 2.468 81.267 1.003 86.801 91.573 95.857 42.697 42.697 2.951 27.425 70.123 2.470 11.144 81.267 1.893 第7页 共14页
2.494 98.351 1.398 99.749 100.00 .023 .251 0 提取方法:主成分分析法。 7 8 9 .224 .126 5. 实验结果分析: 从相关性矩阵可以看出所选取变量之间的相关性大小,比如篮板和盖帽之间的相关性为0.739,说明他们之间的相关性比较高,从公因子方差表可以看出,主成分分析对各个变量所提取的量都超过了0.6,说明,我们选取的变量还是比较好的。从总方差解释表和碎石图可以看出,数据一共被提取了3个主成分,累计方差贡献率为81.267%,虽然没有达到85%,但是也可以接受。从最后的结果得出,我们用三个主成分解释了所由9个变量,解释率达到了81.367%,在可接受的范围以内。 四.因子分析: 1.实验内容: 对各地区年平均收入进行因子分析,数据如下表: 各地区年平均收入 地区 北京 天津 河北 山西 内蒙古 辽宁 国有经济单位 10907 8689 6066 5791 5462 6226 集体经联营经股份制经济单位 济单位 济单位 8259 5083 3843 3177 3551 3583 9917 5667 5073 3349 5290 3789 12864 11829 6029 5267 4407 6618 第8页 共14页
外商投资经济单位 18058 11797 6323 6367 5512 9158 港澳台其他经济经济单单位 位 14945 37096 8950 5109 6186 7125 6290 5044 4599 3581 7417 4899 吉林 6017 3813 7403 7471 7402 6659 黑龙江 5323 2747 4472 8066 5513 5933 上海 11733 7329 8746 12698 16857 14175 江苏 7745 5183 7390 9144 9153 7352 浙江 8847 7026 7346 9356 10417 9500 安徽 6039 3692 4830 6306 6042 5511 福建 7621 5582 11124 8556 8336 8732 江西 5303 3636 6056 7987 8545 7535 山东 6817 4186 6420 6257 6782 5826 河南 5643 3797 5912 4989 6409 5307 湖北 5741 3731 5193 5319 8237 6769 湖南 5683 3736 6218 5027 7929 5224 广东 10032 6814 11036 12475 12410 11140 广西 5654 4437 5296 6536 6765 5577 海南 5468 4208 7010 11062 9077 8373 重庆 5828 4016 3852 6166 9114 8361 四川 5996 3982 4642 6333 6707 5568 贵州 5434 3556 3778 6686 7313 7048 云南 7237 5473 5065 7710 8388 8109 西藏 10524 4588 5918 9558 7114 7084 陕西 5452 3177 4482 7067 6613 5621 甘肃 6445 4598 4356 5146 10043 6272 青海 7623 3419 2248 5701 5391 4979 宁夏 6206 4831 4144 6446 9512 4716 新疆 6709 5849 5258 7460 6754 8324 2. 实验目的: 掌握因子分析的基本思想,并能够对分析结果进行解释。 3. 实验环境 SPSS软件。 4. 实验过程: 6811 3266 12720 6864 8178 5605 7507 4465 2351 4995 4963 3713 7713 6189 8462 7025 4509 3661 11793 6292 7030 3296 2588 1042 4351 (1) 考察原有变量是否适合进行因子分析 首先考察原有变量之间是否存在线性关系,是否采用因子分析提取因子。借助巴特利球度检验和KMO检验方法进行分析,结果如图: 由表可知,巴特利特球度检验统计量观测值为176.534,p值接近0,显著性差异,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0.860,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。 (2) 提取因子: 进行尝试性分析:根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值。 具体结果见表:可知,initial一列是因子分析初始解下的共同度,表明如果对原有7个变量采用主成分分析法提取所有特征值,那么原有变量的所有方差都可以被解释,变量的共同度均为1.事实上,因子个数小于第9页 共14页
原有变量的个数才是因子分析的目的,所以不可以提取全部特征值。第二列表明港澳台经济单位、集体经济单位以及外商投资经济单位等变量的绝大部分信息(大于83%)可被因子解释。但联合经济、其它经济丢失较为严重。因此,本次因子提取的总体效果不理想。 重新制定提取特征值的标准,指定提取2个因子,分析表:可以看出,此时所有变量的共同度均较高,各个变量的信息丢失较少。因此,本次因子提取的总体效果比较理想。 表中第一列是因子编号,以后三列组成一组,每组中数据项为特征值、方差贡献率、累计方差贡献率。第一组数据项(2-4列)描述因子分析初始解的情况。在初始解中由于提取了7个因子,因此原有变量的总方差均被解释,累计方差贡献率为100%。 第二组(5-7列)描述了因子解的情况。由于指定提取2个因子,2个因子共解释原有变量宗法差的84%,总体上丢失原有信息量较少,因子分析效果理想。 第三组(8-10列)描述了最终因子解的情况。因子旋转后,总的累计方差贡献率没有发生改变,也就是没有影响原有变量的共同度,但却重新分配了各个因子的解释原有变量的方差,改变了各因子方差贡献,使得因子更易被解释。 图中,横坐标为因子数目,纵坐标为特征值。可以看出,第1个因子特征值很高,对解释原有变量的贡献最大,第3个以后的因子特征值都较小,对解释原有变量的贡献很小。因此提取两个因子是合适的。 第10页 共14页