中国粮食产量影响因素分析

2018-12-21 13:10

中国粮食产量影响因素分析

应用统计案例库封面

案例名称: 作者: 教学目的: 中国粮食产量影响因素分析 刘文卿 薛立波 用回归分析方法分析粮食产量影响因素,建立回归模型反映变量间的数量关系。正确诊断并处理经济变量的多重共线性。 适用课程: 学习本案例的 前期知识准备: 本案例的知识点:

应用回归分析 回归分析、SPSS软件 回归分析 多重共线性 岭回归 中国粮食产量影响因素分析

一、案例背景与数据介绍1

影响中国粮食产量的主要因素有农业化肥施用量、粮食播种面积、成灾面积、农业机械总动力、农业劳动力、政策因素等。根据<<中国统计年鉴>>查得的数据,选择从1983年到2004年的数据进行分析。选取的变量及单位、各项数据为下表:

年份 粮食产量 (万吨) Y 农业化肥 施用量 (万公斤) X1 1659.8 1739.8 1775.8 1930.6 1999.3 2141.5 2357.1 2590.3 2806.1 2930.2 3151.9 3317.9 3593.7 3827.9 3980.7 4083.7 4124.3 4146.4 4253.8 4339.4 4411.6 4636.6 粮食播种 面积 (千公顷) X2 114047 112884 108845 110933 111268 110123 112205 113466 112314 110560 110509 109544 110060 112548 112912 113787 113161 108463 106080 103891 99410 101606 成灾面积 (公顷) X3 16209.3 15264.0 22705.3 23656.0 20392.7 23944.7 24448.7 17819.3 27814.0 25894.7 23133.0 31383.0 22267.0 21233.0 30309.0 25181.0 26731.0 34374.0 31793.0 27319.0 32516.0 16297.0 农业机械 总动力 (万千瓦)X4 农业劳动力 (万人) X5 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 38728 40731 37911 39151 40208 39408 40755 44624 43529 44264 45649 44510 46662 50454 49417 51230 50839 46218 45264 45706 43070 46947 18022 19497 20913 22950 24836 26575 28067 28708 29389 30308 31817 33802 36118 38547 42016 45208 48996 52574 55172 57930 60387 64028 31645.1 31685.0 30351.5 30467.0 30870.0 31455.7 32440.5 33330.4 34186.3 34037.0 33258.2 32690.3 32334.5 32260.4 32434.9 32626.4 32911.8 32797.5 32451.0 31990.6 31259.6 30596.0

1

本例选自中国人民大学统计学院2005级本科生薛立波的应用回归分析课程作业,第一至第三部分是作业节选,指导教师刘文卿做了适当修改,第四部分是指导教师的评注与改进。

中国粮食产量影响因素分析

二、分析过程

1. 在SPSS中计算增广相关阵,分析变量间的相关性,输出结果如下:

Correlations粮食产量粮食产量Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N122.817**.00022.027.90322.284.20122.634**.00222.460*.03122农业化肥施用量.817**.00022122-.523*.01322.525*.01222.950**.00022.224.31622粮食播种面积.027.90322-.523*.01322122-.312.15722-.698**.00022.370.09022成灾面积.284.20122.525*.01222-.312.15722122.488*.02122.318.14922农业机械总动力.634**.00222.950**.00022-.698**.00022.488*.02122122.028.90122农业劳动力.460*.03122.224.31622.370.09022.318.14922.028.90122122农业化肥施用量粮食播种面积成灾面积农业机械总动力农业劳动力**. Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed).

从相关阵发现,Y与X2的相关系数只有0.027,很小,P值=0.903,很大,数据上说明这些年粮食播种面积对粮食产量无显著影响。与X3的相关系数为0.284,P值=0.201,也不太显著,与X1、X4、X5的相关系数相对要大些。但从实际情况来看,粮食是土地密集型的农产品,我们还没有能不依赖于土地的大规模粮食生产技术,与这里的分析有很大出入。统计学的知识告诉我们,不能仅凭简单相关系数的大小来决定变量的取舍。

2. 选用多元线性回归模型进行分析。用SPSS对原始数据作全部5个自变量的线性回归,输出结果为:

Model Summary

Adjusted R Model 1

ANOVAModel1Sum ofSquares3E+00866036483E+008df51621Mean Square67164422.13412728.008F162.733Sig..000Std. Error of the Estimate 642.43911 R .990 R Square .981 Square .975 RegressionResidualTotal

中国粮食产量影响因素分析

CoefficientsaUnstandardizedCoefficientsBStd. Error-20522.08068.6456.544.637.500.067-.131.032-.143.051-.074.184StandardizedCoefficientsBeta1.645.490-.177-.500-.020Model1(Constant)农业化肥施用量粮食播种面积成灾面积农业机械总动力农业劳动力t-2.54310.2707.449-4.088-2.797-.402Sig..022.000.000.001.013.693a. Dependent Variable: 粮食产量

复相关系数R=0.990,判定系数R2=0.981, 由判定系数看回归方程高度显著。

方差分析表中, F=162.733,P值=0.000, 表明回归方程高度显著,X1、X2、X3、X4、X5在整体上对Y有高度显著线性影响。

进行回归系数的显著性检验,从回归系数表中看到:X2的P值=0.000,对因变量的影响显著。X3的P值=0.001, 对因变量的影响显著。充分说明在多元线性回归中不能仅凭简单相关系数的大小而决定变量的取舍。X1的P值=0.022,X4的P值=0.013,影响都显著。而农业劳动力X5的P值=0.693>0.05,影响不显著,可以剔除。中国是人口大国,农村劳动力一直过剩,所以农业劳动力因素对粮食产量的影响确实不会明显,非常符合数据分析的结果。

剔除x5后线性回归结果为:复相关系数R=0.990,决定系数R=0.981,由决定系数看回归方程高度显著。方差分析表中,F值变为213.929,P值=0.000,回归方程仍然高度显著。回归系数表为:

CoefficientsaUnstandardizedCoefficientsBStd. Error-21831.27196.9276.445.573.492.063-.135.030-.137.048StandardizedCoefficientsBeta1.620.482-.183-.4802Model1(Constant)农业化肥施用量粮食播种面积成灾面积农业机械总动力t-3.03311.2487.866-4.557-2.870Sig..008.000.000.000.011a. Dependent Variable: 粮食产量

从显著性检验看,x1、x2、x3的p值都接近0,x4的p值=0.011< 0.05,都通过了显著性检验。 所以剔除x5后得到多元线性回归方程为:

y??21831.2?6.445x1?0.492x2?0.135x3?0.137x4

从实际角度进行分析,农业化肥施肥量和粮食播种面积都应该对粮食产量有正相关的影

响,我们从公式中可以看到,x1与x2的系数都为正,从系数上x1、x2符合实际情况。成灾面积对粮食产量有负面影响,系数为负且小,也符合实际情况。但我们看到农业机械总动力(x4)的系数为负,从实际情况来说,农业机械总动力的增加应该有利于粮食的增产,而系数为负,与实际情况看上去有些不符合,下面我们继续进行分析。

上面提到x4的系数符号不能较好的反应实际情况,我们考虑回归模型的基本假设是否违

中国粮食产量影响因素分析

背了实际情况,也就是是否存在自相关性、异方差性或多重共线性给回归模型的建模带来了影响。通过检验发现不存在自相关和异方差,以下分析多重共线性。

3. 讨论自变量之间是否存在多重共线性,检验是否是多重共线性对回归方程造成了X4的系数得不到合理的解释。

用方差扩大因子法进行诊断,用SPSS软件进行分析计算,输出结果为:

CoefficientsaUnstandardizedCoefficientsBStd. Error-21831.27196.9276.445.573.492.063-.135.030-.137.048StandardizedCoefficientsBeta1.620.482-.183-.480Collinearity StatisticsToleranceVIF.055.305.711.04118.1133.2791.40724.388Model1(Constant)农业化肥施用量粮食播种面积成灾面积农业机械总动力t-3.03311.2487.866-4.557-2.870Sig..008.000.000.000.011a. Dependent Variable: 粮食产量

从结果来看,x1的方差扩大因子VIF1=18.113,x4的方差扩大因子VIF=24.388,都超过了10,说明两者之间存在多重共线性。X1是农业化肥用量,x4是农业机械总动力,两者之间的简单相关系数r14=0.95,高度相关。

下面用岭回归的方法拟合回归方程,消除共线性的影响。 在spss的Syntax中录入语法命令:

INCLUDE'D:\\Program Files\\SPSSEVAL\\Ridge regression.sps'. RIDGEREG DEP=y/ENTER x1 x2 x3 x4. 然后运行,得到分析的数据表和岭迹图为:

K RSQ X1 X2 X3 X4

______ ______ ________ ________ ________ ________ .00000 .98052 1.620393 .482112 -.182967 -.479766 .05000 .95659 .997550 .582875 -.123332 .145846 .10000 .93538 .840103 .550834 -.094243 .241948 .15000 .91398 .751428 .509874 -.072993 .270797 .20000 .89212 .688923 .470806 -.056277 .279468 .25000 .87027 .640369 .435441 -.042715 .280144 .30000 .84881 .600645 .403850 -.031510 .277227 .35000 .82801 .567094 .375691 -.022133 .272617 .40000 .80800 .538137 .350546 -.014205 .267227 .45000 .78885 .512750 .328019 -.007449 .261524 .50000 .77058 .490221 .307761 -.001652 .255760


中国粮食产量影响因素分析.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:无机化学练习(下)天津理工大学

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: