数学建模·中国GDP趋势分析与预测(2)

2019-01-26 16:21

它可以用来衡量拟合优度。 2、判定系数R

判定系数R是衡量拟合优度的一个重要指标,它的取值介于0与1之间,其计算公式为:

22R2?1??)?(y?yiin2?(y?y)ii?1i?1n (1-5)

2R2越接近于1,拟合程度越好;反之越差。

3、相关系数

相关系数是一个用于测定因变量与自变量之间线性相关程度的指标,其计算公式为

r??(x?x)(y?y)iii?1n?(x?x)?(y?y)2iii?1i?12nn. (1-6)

2相关系数r与判定系数R之间存在关系式:

r??R2

但两者的概念不同,判定系数R用来衡量拟合优度,而相关系数r用来判定因变量与自变量之间的线性相关程度。

相关系数的数值范围是?1?r?1,当r?0时,称x与y正相关;当r?0时,称x与y负相关;当r?0时,称x与y不相关;当r?1,称x与y完全相关,r越接近于1,相当程度越高。

相关系数的显著性检验,简称相关检验,它是用来判断y与x是否显著线性相关的。

相关检验要利用相关系数表,步骤如下:

首先计算样本相关系数r值。然后根据给定的样本容量n和显著性水平a查相关系数表,得临界值ra,最后进行检验判断:

2若r?ra,则x与y有显著的线性关系;若r?ra,则x与y的线性相关关系不显著4、回归系数显著性检验

回归系数的显著性检验可用t检验法进行,令

tb1?b1 (1-7) Sb1S,tb1?t(n?2),

2其中 Sb1??(x?x)ii?1n取显著性水平?(Pt?ta)??),若tb1?ta,则回归系数b1显著,此检验对常数项亦适用。

5、F检验

统计量

F???y)?(yii?1in2?)?(y?yii?1n (1-8)

2(n?2)

服从F(1,n?2)分布,取显著性水平?.若F?F,则表明回归模型显著;(?1,n-2)如果F?F?(1,n?2),则表明回归模型不显著,改回归模型不能用于预测。 6、DW统计量

DW统计量是用来检验回归模型的剩余项?i之间是否存在自相关的一种十分有效的

方法。

DW??(?i?2ni??i?1)2 (1-9)

2i??i?1n?i 式中 ?i?yi?y将利用式(1-9)计算而得到的DW值与不同显著性水平?下的DW值之上限d?和下限进行比较,来确定是否存在自相关。DW值应在0?4之间。

当DW值小于或等于2时,DW检验法则规定: 如果DW?dl,则认为?i存在正自相关; 如果DW?d?,则认为?i无自相关;

如果dl?DW?d?,则不能确定?i是否有自相关。

当DW值大于2时,DW检验法则规定: 如果4?DW?dl,则认为?i存在负自相关; 如果4?DW?d?,则认为?i无自相关;

如果dl?4?DW?d?,则不能确定?i是否有自相关

根据经验,DW统计量的值在1.5?2.5之间时表示没有显著自相关问题。 以上检验可利用统计软件包进行回归时同时完成

Step4、进行预测

预测可分为点预测和区间预测两类,在一元线性回归中,所谓点预测,就是当给定

x?x0时,利用样本回归方程求出相应的样本拟合值y0?b0?b1x0,以此作为因变量个别

值y0和其均值E(y0)的估计。

区间预测是给出一个在一定概率保证程度下的预测置信区间。

进行区间预测,首先要进行点预测,确定x0的值,求得y0的预测值y0。 y0的置信度为100(1??)%的预测区间的端点为:

y0?t?Sc0 (1-10)

其中,S为标准偏差,t0可由t分布表查得,其自由度为n?2,满足P(t?t?)??,而

c0?1?1?n?x?x???x?x?20nii?12

ARIMA模型建模步骤

数据平稳化处理[2]

首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF单位根检验来精确判断该序列的平稳性。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为 ARIMA?p,d,q?模型中的阶数

d。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应

当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过2次。

数据平稳化处理后,ARIMA?p,d,q?模型即转化为ARMA?p,q?模型。

模型识别

我们引入自相关系数和偏自相关系数这两个统计量来识别ARMA?p,q?模型的系数特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。

在平稳时间序列自相关函数和偏自相关函数上初步识别ARMA模型阶数p和q,然后利用AIC定则准确定阶。AIC准则:最小信息准则,同时给出ARMA模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。关于ARMA?p,q?模型,AIC函数定义如下:

[3]

AIC?nlog?2?2?p?q?

式中:n平稳序列为样本数,?为拟合残差平方和,p,q为参数。 AIC准则定阶方法可写为:

2

AIC?p,q??minAIC?k,l?k,l0?k?M,0?l?H

其中:M,N为ARMA模型阶数的上限值,一般取为根号n或n/10。实际应用中p,

q一般不超过2。 参数估计

确定模型阶数后,应对ARMA模型进行参数估计。本文采用最小二乘法OLS进行参数估计,需要注意的是,MA模型的参数估计相对困难,应尽量避免使用高阶的移动平均模型或包含高阶移动平均项的ARMA模型。

模型检验[4]

完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t检验完成的Q检验的零假设是H0:?1??2??????k即模型的误差项是一个白噪声过程。Q 近似服从?2统计量定义为Q?T?T?2?

?k?p?q?分布,其中T表示样本容量,rk表示用残差序列计算的自相

关系数值,k表示自相关系数的个数,p表示模型自回归部分的最大滞后值,q表示移动平均部分的最大滞后值。用残差序列计算Q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则Q值将很大,反之Q值将很小。判别规则是:

若Q????k?p?q?,则接受H0。

2 若Q????k?p?q?,则拒绝H0。

2其中?表示检验水平。

模型求解

回归分析模型的模型求解

从图1中我们大致可以确定该图与幂函数多项式的图象较为相近,所以我们建立了多

项式模型,运用matlab计算得到表二

表二 回归检验参数

多项式的次数 2 3 4 5 6 7 9 决定系数R 0.9659 0.9845 0.9922 0.9981 0.9988 0.9991 0.9991 回归方程的F统计 396.7026 572.8865 826.3737 2646.0241 3284.6603 3543.7730 3236.8805 拒绝无效假设的概率 0 0 0 0 0 0 0 根据多项式模型的检验方法,二次,三次及四次多项式大部分指标差别不大,拟合效果比较差,从五次到七次多项式拟合效果越来越好,到八次多项式F值突然减小,造成拟合效果下降,于是本文选择了七次多项式来拟合。

利用matlab统计工具求解,得到回归系数估计值及置信区间(置信水平?=0.05)见表三

表三 模型计算结果

参数 参数估计值 参数置信区间


数学建模·中国GDP趋势分析与预测(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:内外倾向性格测验

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: