中国货运量预测方法研究 - 图文(4)

2020-04-21 00:21

张创:中国货运量预测方法研究

第3章多元线性回归模型

3.1 多元线性回归模型理论介绍

3.1.1 多元线性回归模型

回归分析是一种应用极为广泛的数量分析方法,是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。它用于分析事物之间的统计关系,侧重观察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,有助于人们准确的把握因变量与自变量之间的关系,进而为预测提供了科学依据。

回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。因为货运量往往受很多因素影响,处理这类经济问题单用一元线性回归模型是远远不够的,所以在此研究中,必须考虑多元的线性回归模型,多元线性回归模型跟一元线性回归模型类似,只不过在具体计算上较为复杂。

多元回归分析是研究一个因变量与多个自变量之间的相关关系,而且总是假设因变量为随机变量,而自变量为一般变量。

设因变量为Y,X1,X2,...,Xk为k个自变量,多元线性回归模型的数学模型为:

y??0??1x1??2x2??3x3????kxk??

如果收集到的n组数据?yi,x1i,x2i,?,xki? ?i?1,2,?,n?,多元线性回归模型变形为:

?yi??0??1x1i??2x2i????kxki??i(i?1,2,?,n) ?2?~N(0,?I)nn?3.1.2 拟合优度检验

为了检验总的回归效果, 人们常引用无量纲指标复相关系数

R2?syy?QQU或R?1? ?syysyysyyn??2n?2其中U??(yi?y),Q??(yi?yi)

i?1i?1R称为复相关系数。很显然0?R2?1,R2越大说明回归方程与样本值拟合得越好,反之越差。由于R2与模型中的解释变量个数有关,即如果观测值将随解释变量的数目增大而增大,因而需对R2进行调整。

调整后的决定系数,即修正后的R2?1?(1?R2)?n?1,其中k为变量个数。因

n?k?1x不变,决定系数R2- 10 -

安徽工程大学毕业设计(论文)

此多元线性回归方程的的拟合优度检验采用修正的R2,修正的R2越接近1,说明回归方程对样本数据点的拟合优度越高,反之,修正的R2越接近于0,说明回归方程据点的拟合优度越低。

3.1.3回归方程的显著性检验

回归方程的显著性检验就是检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当。

利用F检验对回归方程进行显著性检验的方法称为方差分析。检验统计量

F?U/k~F(k,n?k?1),

Q/(n?k?1)对于给定的置信度?, 由F分布表可查得F(k,n?k?1)的值, 如果根据统计量算得的F值为F?F(k,n?k?1), 则拒绝原假设, 即k个自变量的总体回归效果是显著的, 否则认为回归效果不显著。

3.1.4回归系数的显著性检验

回归系数的显著性检验的主要目的是研究回归方程中的每个解释变量与被解释变量之间是否存在显著的线性关系,也就是研究每个解释变量能否有效地解释被解释变量的线性关化,它们能否保留在线性回归方程中。

3.1.5残差分析

残差是指由回归方程计算所得的预测值与实际样本值之间的差距,残差分析是回归方程检验中的重要组成部分,如果回归方程能够较好的反映被解释变量的特点和变化趋势,那么残差序列中就不因该包含明显的规律和趋势性。是否存在自相关性,采用DW统计量进行检验。

3.2 数据来源

在此研究中,我们以货运量为因变量,国内生产总值、社会消费品零售总额、固定资产投资总额、能源生产总值、进出口贸易为自变量,数据来源于中国统计年鉴,见下表:

- 11 -

张创:中国货运量预测方法研究

表3-1各种指标的原始数据 年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 货运总量(万吨) 970602 985793 1045899 1115902 1180396 1234938 1298421 1278218 1267427 1293008 1358682 1401786 1483447 1564492 1706412 1862066 2037060 2275822 2585937 2825222 3241807 3696961 国民生产总值(亿元) 18718.3 21826.2 26937.3 35260.0 48108.5 59810.5 70142.5 78060.9 83024.3 88479.2 98000.5 108068.2 119095.7 134977.0 159453.6 183617.4 215904.4 266422.0 316030.3 340320.0 399759.5 472115.0 能源(万吨) 103922 104844 107256 111059 118729 129034 133032 133460 129834 131935 135048 143875 150656 171906 196648 216219 232167 247279 260552 274619 296916 317987 进出口贸易额(亿元) 5560.1 7225.8 9119.6 11271.0 20381.9 23499.9 24133.8 26967.2 26849.7 29896.2 39273.2 42183.6 51378.2 70483.5 95539.1 116921.8 140974.0 166863.7 社会商品零售额 8300.1 9415.6 10993.7 14270.4 18622.9 23613.8 28360.2 31252.9 33378.1 35647.9 39105.7 43055.4 48135.9 52516.3 59501.0 67176.6 76410.0 89210.0 固定投资额 6955.81 9810.40 12443.12 14410.22 17042.94 20019.30 22974.00 24941.10 28406.20 29854.70 32917.70 37213.50 43499.90 55566.60 70477.43 88773.61 109998.16 137323.94 172828.40 224598.77 278121.85 311485.13 179921.5 108487.7 150648.1 132678.4 201722.1 156998.4 236402.0 183918.6 3.3 实证分析

3.3.1 建立模型

我们以货运量为因变量,国内生产总值、社会消费品零售总额、固定资产投资总额、能源生产总值、进出口贸易为自变量建立多元线性回归模型,其数学模型是:

y??0??1x1??2x2??3x3??4x4??5x5??

运用SPSS软件,采用逐步回归的方法,得出回归方程如表3-2所示。

- 12 -

安徽工程大学毕业设计(论文)

表3-2 逐步回归方程

标号 1 2 3 4 5 回归方程 货运量 = 1007285.015+1.694×国民生产总值+4.463×社会消费品零售总额+3.232×固定资产投资总额-0.983×能源生产总值+1.394×进出贸易 货运量 = 910066.340+3.922×社会消费品零售总额+3.297×固定资产投资总额+1.734×国民生产总值+0.687×进出口贸易 货运量 = 906937.011+2.113×社会消费品零售总额+3.289×固定资产投资总额+2.786×国民生产总值 货运量 = 917658.053+3.326×国民生产总值+3.658×固定资产投资总额 货运量 = 1047133.941+8.386×固定资产投资总额

3.3.2 拟合优度检验

运用SPSS软件分析,得到上述各方程的拟合优度,如表3-3所示。

表3-3 拟合优度检验

标号 1 2 3 4 R 0.9991 0.9991 0.999 0.9989 0.9985

R 平方 0.9981 0.9981 0.9981 0.9977 0.997 修正的R 平方 0.9971 0.9974 0.9975 0.9974 0.9968 估计的标准误差 34751.003 34565.943 34162.617 34165.184 79954.957 由表3-3可知:五个模型的修正的R2都比较接近于 1,因此可以认为,拟合优度都比较好。最后一个回归方程修正的R2最接近于1,则说明最后一个回归方程拟合的最好。 3.3.3回归方程的显著性检验

对回归效果的讨论可归结于一个方差分析表中,如表3-4所示。

- 13 -

张创:中国货运量预测方法研究

表3-4 方程的显著性检验表

标号 1 回归 残差 总和 2 回归 残差 总和 3 回归 残差 总和 4 回归 残差 总和 5 回归 平方和 2 514 198 077 375.31 4 711 595 121.00 2 518 909 672 496.31 2 514 197 407 508.73 4 712 264 987.58 2 518 909 672 496.31 2 514 053 326 239.95 4 856 346 256.37 2 518 909 672 496.31 2 513 190 573 467.77 5 719 099 028.55 2 518 909 672 496.31 2 511 329 052 589.33 自由度 5 9 14 4 10 14 3 11 14 2 12 14 1 均方 502 839 615 475.06 523 510 569.00 628 549 351 877.18 471 226 498.76 838 017 775 413.31 441 486 023.30 F值 960.51 1 333.86 1 898.18 显著性 0.00 0.00 0.00 0.00 0.00 1 256 595 286 733.88 2 636.623 476 591 585.71 2 511 329 052 589.33 4 306.6765 残差 7 580 619 906.98 13 583 124 608.23 总和 2 518 909 672 496.31

3.3.4回归系数的显著性检验

14 由上表可知,五个模型的方程都是显著的。

通过逐步回归法对变量进行选择,如果显著则保留在回归方程中,否则剔除,检验结果如表3-5所示。

- 14 -


中国货运量预测方法研究 - 图文(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:高端会所 - 图文

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: