这里对上述数据已作了标准化处理。这样公因子,?i,i?1,2,............,l可 以假定为均值为0,方差为1的正态变量;?i可以认为均值为0,方差为?i2的变量。
假定:A?E(XTX),代入得E(XTX)?E(P?T??T)T(P?T??T)
??12?2?2??化简得:E(XTX)?P?PT?E(?T?),其中E(?T?)??...?...?2??n?????? ??????六、模型求解
6.1线性回归模型求解
由题目中所给的1978-2009年甘肃省农村居民收入与消费统计数据利用Eviews6.0软件,做农村居民消费水平与农村居民人均纯收入线性图,结果如下(图1):
(图1)
从图1可看出,1978-2007年间农村居民人均收入水平和消费之间的差距并不大且增长缓慢。人均消费水平的增长速度明显低于农村人均纯收入的增长速度。因为随农民收入的提高,消费支出的比重逐渐变小,说明农民的生活水平在提高。
农村居民消费水平与农村居民人均纯收入直接作回归分析得到回归分析数据表(表一):
(表一)
可得回归方程为:Ct?0.86050Yt?24.43431
所估计的参数 k=0.860504且0 6.3.1 消费支出因子模型的求解 根据第三题题意结合甘肃的实际情况分析影响收入与消费的因素,因此通过对《甘肃农村年鉴》中部分数据的整理得到2000年至2009年甘肃农村人民(人均)生活支出数据(表二): 2000年至2009年甘肃农村人民(人均)生活支出[7] 人均生年份 活消费食品 支出 2000 1084 1127.32001 7 1153.22002 9 1336.82003 5 1464.32004 4 1819.52005 8 1855.42006 9 2007 2017 2400.92008 5 2009 2766 衣着 居住 家庭设文化教交通和医疗保备用品育用品通讯 健 与服务 及服务 95.39 144.19 108.99 172.99 156.1 113.91 174.6 149.86 234.69 238 129.75 188.61 142.55 101.89 142.63 155.03 228.41 186.17 219.91 217 208.55 105.18 159.96 121.25 118.13 257.83 127.29 208.76 164.72 180 290.5 77.07 314.65 80.27 336.18 85.92 408.54 99.06 404 191.54 61.79 204.28 64.26 221.55 70 280.2 70.32 103.24 420.12 93.57 240.73 74.06 251.79 78.67 858.84 92.22 865.96 97.23 943.96 112.15 295.29 91.37 1132.5134.66 387.83 95.58 3 1142 157 649 143 (表二) 通过对上表数据应用spss16.0软件[8]进行因子分析得到人均消费影响因子的相关性系数表(表三): (表三) 由上图分析,可知在所有影响人均生活消费支出的因素中,食品支出因素与衣着支出因素在其中占有很重要的地位。与消费支出的相关性系数分别达到了0.964、0.930。再由由数据处理后的得到的各因子贡献值数据表(表四): (表四) 分析可得到食品消费因子与衣着消费因子在农村居民消费总值中的贡献值分别达到所有因子中的最高70.186%和16.304%。 因此综合上述数据可以得出在影响甘肃农村居民的消费因素中主要为食品消费和衣着消费。 6.3.2 收入因子模型的求解 同理根据从《甘肃农村年鉴》整理的数据表(表五): 2000年至2009年甘肃省农村人民收入数据表 年份 人均耕地收入 人均外出务工收入 养殖收入 其他收入 总计 2000 241.29 571.13 468.99 147.29 1428.7 2001 243.28 628.23 469.38 167.72 1508.61 2002 2003 2004 2005 2006 2007 2008 2009 723.31 527.58 90.66 1590.3 743.17 565.93 106.48 1673 752.45 612.51 155.55 1852 770.09 663.71 160.99 1980 823.83 726.75 175.53 2134 856.68 795.95 185.65 2328.92 1028.7 872.06 315.33 2723.8 1019.45 959.4 474.48 2980.1 (表五) 通过对上表数据应用spss16.0软件进行因子分析得到人均消费影响因子的相关性系数表(表六): 248.75 257.42 331.49 385.21 407.89 490.64 507.71 526.77 (表六) 由上图分析,可知在所有影响甘肃农村人民收入的因素中,外出务工收入因素与养殖收入因素在其中占有很重要的地位。与收入的相关性系数分别达到了0.993、0.968。 再由数据处理后的得到的各因子贡献值数据表 (表七): (表七) 分析可得到外出务工因子与养殖因子在农村居民收入总值中的贡献值分别达到所有因子中的最高90.686%和7.003%。 因此综合上述数据可以得出在影响甘肃农村居民的收入因素中主要为外出务工收入和养殖收入。 七.因子模型检验 7.1线性回归模型检验 7.1.1拟合优度检验[5](R2检验) 可绝系数R=0.979045, 2R2=0.978347,这说明所建模型整体上对样本数据拟 合较好,即解释变量 “农村居民家庭人均纯收入”对被解释变量“农村居民消费水平”的绝大部分差异作了解释。 7.1.2 F检验[6] 针对H0:L=0,给定显著性水平?=0.05,在F分布表中查出自由度为K-1=2和n-K=17的临界值F,由图(二)中得到F=0.979045>F?(2,17)=19.4,应拒绝原假设H0:L=0,说明回归方程显著,即“农村居民家庭人均纯收入”确实对“农村居民消费水平”有显著影响。 综上所述:表明用回归方程Ct?0.86050Yt?24.43431来预测农村消费水平可靠性大。 7.2 因子模型的检验 7.2.1KMO检验[9] KMO(Kaiser-Meyer-Olkin)检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。主要应用于多元统计的因子分析。 KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。kmo度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。 7.2.2 巴特利特球形检验[9] 巴特利特球形检验是以变量的相关系数矩阵为出发点的。它的零假设相关系数矩阵是一个单位阵,即相关系数矩阵对角线上的所有元素都是1,所有非对角线上的元素都为零。巴特利特球形检验的统计量是根据相关系数矩阵的行列式得到的。如果该值较大,。且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数不可能是单位阵,即原始变量之间存在相关性,适合于作因子分析。相反不适合作因子分析。 通过spss16.0对上述数据分别进行KMO检验和巴特利特球形检验得到以下结果表(八)、(表九):