表一 出生率与人口数的相关性
相关性 出生率 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 人口数 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 出生率 1 人口数 -.877** .000 -2882617.100 -73913.259 40 1 1144.808 29.354 40 -.877** .000 -2882617.100 -73913.259 40 9.445E9 2.422E8 40 **. 在 .01 水平(双侧)上显著相关。
表二 死亡率与人口数的相关性 相关性 死亡率 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 人口数 Pearson 相关性 显著性(双侧) 平方与叉积的和 协方差 N 死亡率 1 人口数 -.512** .001 5.338 .137 40 -.512** .001 -115009.401 -2948.959 40 -115009.401 -2948.959 40 1 9.445E9 2.422E8 40 **. 在 .01 水平(双侧)上显著相关。 由表可知,人口数量与出生率之间的相关系数为-0.877,说明两者之间存在很强的负相关性;人口数量与死亡率的相关系数为-0.512,说明两者之间存在比较强的负相关性。我们看到在上表的相关系数的右上角有两颗星号(**),表示显著性水平为0.01时拒绝原假设,当只有一个星号时,表示显著性水平为0.05时可以拒绝原假设,因此,两个星号比一个星号拒绝原假设犯错误的可能性更小。根据相关性,我们可以看出,人口的数量与出生率和死亡率密切相关。在制定控制人口的政策时可以从出生率和死亡率方面着手。 4、运用ARIMA模型预测我国人口
ARIMA模型全称为差分自回归移动平均模型。是由博克思和詹金斯于70年代初提出的一著名时间序列预测方法,博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。【摘自统计预测与决策】 4.1 数据的选取
文章选取的数据来源于2010年中国统计年鉴(附件一)。
表三 我国1970-2010年人口数据
我国人口数年份 1970 1971 1972 1973 1974 1975 1976 1977 1978 (万人) 82992 85229 87177 89211 90859 92420 93717 94974 96259 1991 1992 1993 1994 1995 1996 1997 1998 1999 115823 117171 118517 119850 121121 122389 123626 124761 125786 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 4.2 平稳性检验
97542 98705 100072 101654 103008 104357 105851 107507 109300 111026 112704 114333 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 126743 127627 128453 129227 129988 130756 131448 132129 132802 133450 首先绘制年份与人口数的时序图。建立人口时序图5。观察时序图5可以初步确定该序列有一定的趋势,不具有周期性。
然后对人口数据进行ADF检验,结果如图6。
图6 ADF检验
在图6 ADF检验中可以看到ADF值为-1.236235,ADF的值小于level(1),level(2),level(3).的三个水平条件下的值,所以认为该序列为一个平稳序列。
4.3 序列的初步处理
ARIMA (p, d, q) 模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得利用EVIEWS计算出该时间序列的自相关函数ACF和偏自相关函数PACF,见表1。从表1中可以看出,自相关函数(ACF) 表现出阻尼的正弦-余弦波动,偏自相关函数(PACF)在1阶以后接近于零。所以,可以初步判断模型的阶数,并用ARIMA 模型进行拟合,其中p=1,q=0,d=0。
图7 自相关函数和偏自相关函数
4.4模型的确定
确定ARIMA模型的具体参数后,下一步需要利用EVIEWS软件算出拟合模型的参数,结果如下图8 ARIMA模型参数。
图8 ARIMA模型参数
由图8可以看出R2为0.99,表明拟合程度十分好。同时,各个参数的t值较大,表明参数显著性好,故该模型是显著有效的。
由此,可以得出人口预测模型:
AR模型:xt?171930.8?11?0.978768B?t
4.5模型检验
模型的显著性检验主要是检验模型的有效性。一个模型是否显著有效主要看它提取的信息是否充分。一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,换言之,拟合残差项中将不再蕴含任何相关信息,即残差序列应该为白噪声序列。这样的模型称之为显著有效模型。
对残差序列进行白噪声检验,得到表9。可以看出ACF和PACF都没有显著异于零,Q统计量的P值都远远大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分。
常数和滞后一阶参数的P值都很小,参数显著;因此整个模型比较精简,模型较优
表2 残差AFC和PACF