自相关图显示序列有很强的短期相关性,所以可以初步认为一阶差分后序列平稳。
考虑ARIMA(p,d,q)模型,并以最小标准化BIC为指标,应用SPSS软件可构造出ARIMA(0,1,2)模型,即(1?B)Xt?(1??1B??2B)?t这就是说Xt是1阶齐次非平稳序列,一次差分后适合MA(2)模型。
运用SPSS求出参数如表: ARIMA 模型参数 a TREND(tem)-模型_1 TREND(tem) 无转换 差分 MA 滞后 1 滞后 2 估计 1 .360 .271 SE t Sig. .061 .061 5.884 4.438 .000 .000 表四:ARIMA模型参数 t检验合格。均方误差??3.867,绝对误差为2.907,BIC?2.749,复相关系数R2?0.913
从结果来看,?1,?2都通过了显著性检验,数值拟合的误差比较小,进一步考察拟合误差得到的自相关系数及偏自相关系数图可知它们不在具有相关性,说明该模型是合理的。 图五:拟合误差自相关系数及偏自相关系数图
最后得到的模型为?Xt?(1?0.360B?0.271B2)Zt,其中Zt~WN(0.3.8672) 该模型可进一步化简为:
Xt?Xt?1?Zt?0.360Zt?1?0.271Zt?2 其中Zt~WN(0.3.8672)
我们对2010年数据进行预测,部分抽样结果如下表:
tem观察值与预测指表19.45718.34319.93720.51420.12620.24620.36620.48620.60620.726
表五:2010年气温预测抽样表
绘制原始数据及预测数据图,虚线右边中间数据为预测数据,虚线右边上面数据为95%的置信上限,下面数据为95%的置信下限。 真实值预测值真实值预测值真实值预测值真实值预测值真实值预测值真实值预测值真实值预测值-3.73-13.4-3.73-7.09-6.29-8.36-7.3-4.540.63-8.15-5.9-6.83-8.981.872-4.9513.741.5428.4211.3418.7119.518.0618.9718.2820.06-12-11.5-4.73-7.011.717-2.66-4.2-5.03-1.253.29917.6419.1321.52-12.1-9.5-7.92-5.81.13-1.7-7.27-3.29-0.153.19519.6517.99-7.33-11.2-9.77-7.876.196-1.13-13.8-6.174.0212.33620.9619.53-11.1-7.83-9.87-8.510.852.869-8.77-106.4584.43723.1319.98-10.3-11.1-6.52-8.846.7615.9690.125-6.9412.725.27216.6121.63-3.56-9.62-6.02-6.915.8044.1312.313-2.6520.869.58816.2517.39-6.5-5.84-2.06-7.012.375.0011.109-1.4618.5614.8316.0218.12-8.81-8.061.25-4.011.7612.7693.326-1.2315.1513.9519.0517.07 图六:ARIMA模型拟合与观察数据数据时序图 6.2.2 模型的求解
我们用该模型对2010年9月15日至2010年9月21日七天tem作出预测,结果如表: 预测 模型 tem-模型_1 预测 UCL LCL 239 20.514 27.969 13.059 240 20.126 28.965 11.287 241 20.246 29.393 11.099 242 20.366 29.812 10.920 243 20.486 30.221 10.750 244 20.606 30.622 10.589 245 20.726 31.015 10.436
表六:七天温度预测表
6.2.3 各项指标的求解
类似于温度预测的分析求解过程,分别对A、B、C、D、E五个城市的各项污染物浓度以及气象参数进行预测,结果如下:
BCSO2PM10SO2NO2PM10SO2NO2PM109月15日0.0278840.0585230.0179640.035370.0494190.0205770.0310740.0505599月16日0.0278250.0626410.0205530.0329520.049040.0195530.0274530.0501629月17日0.0277940.0604870.0203220.0309610.049320.019020.0274530.0463239月18日0.0277790.0513930.022010.0293220.0491990.0192620.0274530.0472479月19日0.0277710.042040.0234850.0279720.0491090.0191590.0274530.0485839月20日0.0277670.0327220.0242060.0268610.0491170.0211820.0274530.0515939月21日0.0277650.055480.0249680.0259470.0491030.0227950.0274530.051294ESO2PM10SO2NO2PM10mmghtemrhws9月15日0.017540.0777340.009520.0244180.070989665.939820.5140549.696631.1522959月16日0.0131120.069830.0107540.0249250.06621665.939820.1259649.112611.1694179月17日0.0141190.073260.0111820.0251060.064929665.939820.2459148.795141.1522959月18日0.0163090.0727590.0113380.0251710.0739665.939820.3658748.622571.1890779月19日0.0160170.0727320.0129880.0251940.071194665.939820.4858248.528751.1824219月20日0.0200730.0831840.0148940.0252020.076506665.939820.6057748.477761.1731369月21日0.0162260.0783740.0127210.0252050.076614665.939820.7257248.450041.177048
表七:各城市各项指标预测值
6.2.4对于F城市的定性分析
从前一问可以看出,整体城市空气质量排序中,F城市是好于A城市的,在F城市的数据中,只有2004年9月15日至21日。
(1) 绘制A城市2004年9月15日至21日与F城市2004年9月15日至21
日时期三项指标的比较图 ANO20.0260580.024120.0234890.0232830.0232160.0231940.023187DNO20.0132040.013020.0129780.0129680.0129660.0129660.012965图七:A城市与F城市在2004年三项指标比较图 从图上看出,A城市与F城市在2004年9月15日至21日三项指标走势在很大程度上有一定的相似性。
(2)绘制A城市2004年9月15日至21日与2010年9月15日至21日三项指标的整体比较图: 图八:A城市在2004年与2010年三项指标走势图 由图可以看出,三个指标的走势在两年里面没有明显地统一趋势,故对F城市只定性说明:在2010年时三项指标均明显低于2004年。 6.2.5对于F城市的预测
因2010年与2004年的指标走势没有明显线性关系,所以只能定性的分析:F城市污染物各项指标在2010年9月15日至21日的测量数值均低于2004年同期,即F城市的空气质量提高,且优于A城市。
6.3问题3
选取A、B、C三城市,分别运用典型相关性分析,对气象参数(大气压mmgh,温度tem,风速ws,湿度rh)及各项污染物浓度进行分析,判断气象参数的城市属性,再对此城市进行偏相关性分析,得出结论。整个过程由SPSS完成。 6.3.1典型相关性分析
主要思路是将两组变量的相关性研究转化为两个综合变量的相关性研究,这种相关称为典型相关,这两个综合指标称为典型变量。 (1)根据分析目的建立原始矩阵
原始数据矩阵
?x11x12?x1py11y12?y1q??x?x?xyy?y2122p21222q?? ??????xx?xyy?y?n1?n2npn1n2nq??(2)对原始数据进行标准化变化并计算相关系数矩阵
?R11R = ??R21R12? ?R22??为第其中R11,R22分别为第一组变量和第二组变量的相关系数阵,R12= R21一组变量和第二组变量的相关系数
(3)求典型相关系数和典型变量
?1?1?1?1R12R22R21以及矩阵B?R22R21R11R12的特征值和特征向计算矩阵A?R11量,分别得到典型相关系数和典型变量。
(4)检验各典型相关系数的显著性 6.3.2偏相关性分析
偏相关性分析是指当两个变量同时跟第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。
偏相关性分析的工具是计算偏相关系数r12,3。 计算公式:
假定有三个变量:x1,x2,x3,求剔除变量x3的影响后,变量x2和x1之间的偏相关系数r12,3:
r12,3?r12?r13r231?r1321?r232 其中,r12表示变量x1与变量x2的简单相关系数。 r13表示变量x1与变量x3的简单相关系数。 r23表示变量x2与变量x3的简单相关系数。 显著性检验公式:
t?r12,31?rn?3212,3 其中,n为个案数,n?3为自由度。 6.3.3典型相关性分析
运用统计和分析软件SPSS进行典型相关分析。 典型相关性分析程序:
6.3.4典型相关分析结果分析
典型性相关性分析用来讨论在污染物浓度与气象要素两组数据之间存在何种关系。根据所给数据特征,可分为冬季和春季两时段进行分析。
观察结果,可看出C城市的各项污染指标与气象参数的相关性最高,故,可近似认为所给气象参数为C城的气象参数。