多元统计分析课程设计
目录
一.选题背景与选题意义 ............................................................................................................... 1
1.1 背景 .................................................................................................................................... 1 1.2 意义 .................................................................................................................................... 1 二.原理........................................................................................................................................... 1
2.1 因子分析 ............................................................................................................................ 1 三.数据收集与整理 ....................................................................................................................... 2 3.1 源数据........................................................................................................................................ 2
3.2 整理的数据 ...................................................................................................................... 3 四.实证分析 ................................................................................................................................... 4
4.1 因子分析法 .................................................................................................................... 4 五.结果分析 ................................................................................................................................... 8 六.参考文献 ................................................................................................................................... 9 七.附 录......................................................................................................................................... 9
《运输包装》课程设计说明书
一.选题背景与选题意义
1.1 背景
进入21世纪以来,人民的生活得到了巨大改善,生活结构也变得更加复杂。总体来说我们对人民具体生活还不是太了解,为了对人民生活提供具体的数据,我们通过对居民人均购买的食品数量进行分析。 1.2 意义
1.2.1 理论意义
改革开放以来,总体来看人民的生活是上升的趋势,但
是部分地区还是处于贫困的水品。本次分析是以90年到2012年人民购买食品的数量为研究依据,研究人民消费水品。用多元的统计分析方法得出的结论也为相关机构提供了理论依据,对了解人民的总体生活有了大致的了解。 1.2.2 现实意义
本文数据基于全国人民购买食物数量,得出总体人民主要消费的物品,从而得出人民生活状况。对于相关部门制定相关政策的制定有着重要意义。
二.原理
2.1 因子分析
2.1.1 因子分析的思想
因子分析是利用降为的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就成为公共因子。对于所研究的问题就是试图用最少个数的不可预测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一个分量。
1
《运输包装》课程设计说明书
2.1.2因子分析的模型
设x1,x2,...xp是P个可观测的变量,F1,F2,...Fm(其中m?p)是m个不可观测的变量,并且有
P
个变量
?1,?2,...?p分别影响于X1,X2,...Xp。他们满足下列的模型:
?X1?a11F1?a12F2???a1mFm??1???X2?a21F1?a22F2???a2mFm??2 ??????X?aF?aF???aF??3?p11p22pmmp?则称上述模型为一个因子模型,我们可以用矩阵表示为:
X?AF??
其中,F?(F1,F2,?Fm)'称为变量X?(X1,X2?Xp)' 的公共因子(简称为因子), ??(?1,?2,??p)'称为X的特殊因子。特殊因子ε是模型中不能被公共因子所包含的部分,公共因子
F1,F2,?Fm一般对每个Xi都有作用,而每个特殊因子?i只对每
个Xi起作用。矩阵A?(aij)p?m是待估的系数矩阵,aij称为第i个变量在第j个因子上的载荷。
三.数据收集与整理
经过在统计年鉴上数据的筛选,得到以下数据,用以下数据分析国民的食品购买数量推断人民的生活的变化。
3.1 源数据
城镇居民人均购买主要食品数量
2
《运输包装》课程设计说明书
指 标 1990 1995 2000 2005 2010 2011 2012 78.76 112.33 9.14 21.23 3.73 10.75 10.52 15.19 13.95 56.05 6.88 粮 食 130.797.00 82.31 76.98 81.53 80.71 (千克) 2 鲜 菜 138.7116.4114.7118.5116.1114.5(千克) 0 7 4 8 1 6 食用植物油 6.40 7.11 8.16 9.25 8.84 9.26 (千克) 猪 肉 18.46 17.24 16.73 20.15 20.73 20.63 (千克) 牛 羊 肉 3.28 2.44 3.33 3.71 3.78 3.95 (千克) 禽 类 3.42 3.97 5.44 8.97 10.21 10.59 (千克) 鲜 蛋 7.25 9.74 11.21 10.40 10.00 10.12 (千克) 水 产 品 7.69 9.20 11.74 12.55 15.21 14.62 (千克) 鲜 奶 4.63 4.62 9.94 17.92 13.98 13.70 (千克) 鲜 瓜 果 41.11 44.96 57.48 56.69 54.23 52.02 (千克) 酒 9.25 9.93 10.01 8.85 7.02 6.76 (千克) 数据来源:《中国统计年鉴》-----2014 3.2 整理的数据
用通过整理的数据带入程序进行相关分析。
3
《运输包装》课程设计说明书
四.实证分析
4.1 因子分析法
通过整理的数据,用SAS9.2得出以下结果:
表1
由表1可以看到,第一特征值所占比例为0.7278,第二特征值所占比例为0.1967,这俩特征值之和累计比例已经达到0.9245.因此,根据主成分法我们可以取两个公共因子。
表2
表2显示了每个变量在公共因子上的载荷,根据因子载荷阵我们可以建立如下因子模型:
4