参赛密码
(由组委会填写)
“华为杯”第十三届全国研究生
数学建模竞赛
学 校
参赛队号
1.
队员姓名 2.
3.
1
参赛密码
(由组委会填写)
题 目 空气中PM2.5问题的研究
摘 要:
本文主要是分析空气中PM2.5的污染问题,建立了Pearson相关分析、多元线性回归模型、模糊综合评价模型、改进柯西分布函数模型、双目标非线性规划模型等,通过定性定量分析,从与PM2.5相关因素分析、分布与演变以及空气质量控制管理等方面进行研究与分析。
问题一:
1、针对第一问,主要定性定量分析PM2.5余其它5项指标的相关性与独立性。首先,对附件1数据进行初筛和归一化处理,剔除缺失值。其次,建立Pearson相关分析模型,分析了各个AQI指标之间的相关性,发现PM2.5与其它除O3分指标的相关系数均大于0.7,线性相关程度较高;O3与各个分指标均呈负相关。然后,根据正态性原则,选出不满足统计学规律的点,由上述相关性结论检验这些异常点。
2、针对第二问,建立了PM2.5与其它5项分指标之间的多元线性回归模型,并根据剔除缺失值和异常数据求解多元回归方程后,结果为:
y??0.033?0.016x1?0.037x2?1.078x3?0.439x4?0.160x5
问题二: 1、针对第一小问,本文将时空分布规律分别建立时间模型与空间模型进行求解。首先,建立PM2.5与SO2、NO2、PM10的三元线性回归方程来估计数据2中PM2.5中缺失的2010年1月到2012年12月的数据得到PM2.5的时间分布图,然后建立关于PM2.5的二维插值模型得到了关于各地区的空间分布图。最后根据《环境空气质量标准》建立了模糊综合评价模型,并根据最大隶属度原则将13个地区的污染程度进行评估,模型结果表明:13个监测点污染程度为轻度污染的有:小寨、长安区、临潼区、曲江文化集团和纺织城,中度污染的有:阎良区、兴庆小区、经开区、广运潭、市人民体育场、草滩、高新西区和高压开关厂。
2、针对第二小问,本文建立了不同季节下关于风力、湿度、温度的三元线性回归模型,并利用该地的数据对PM2.5的分指标进行定性与定量的分析,针对第三小问,建立了高斯点源扩散模型,分析扩散与衰减现象。
3、针对第三小问,本文建立了PM2.5的浓度扩散模型PM2.5;然后,对PM2.5 污染扩散预测模型进行了参数估计;最后,代入实例得到了各个监测点PM2.5 浓度的预测评估结果,如高新西区为重度污染区域,广运潭为安全区域。
4、针对第四小问,用残差检验与稳定性检验了模型合理性,并总结已有研究成果给出了PM2.5 的成因、演变等一般性规律。
问题三:
1、针对问题一,给出合理的PM2.5治理计划:考虑到实际环境治理过程中,往往是分期进行治理工作的,而且治理进度是先慢变快,再由快变慢(这种变化规律与柯西分布函数的变化规律很相似)。因此可以将PM2.5的治理计划分为前期(准备期),中期(治理期),后期(稳固期)三个时期,并由改进的柯西分布函数对治理计划进行模拟,得出与实际环境治理过程相符的分期治理计划如下:
时期 前期 2
中期 后期 年次 年终平均浓度 治理量 第一年 256.9381 23.0619 第二年 176.5296 80.4089 第三年 101.5913 74.9379 第四年 58.03 43.5613 第五年 35 23.03 2、针对问题二,本文考虑经济投入与决策部门满意度两个因素,建立双目标规划模型,既使得五年投入的总经费较少,又使决策部门对投入金额造成的结果满意度较高。在求解过程中,通过将满意度作为约束条件,将双目标规划转化为单目标规划求解,通过不断改变满意度得出4中不同方案,将4种方案合理对比得到了最后的方案为:五年投入总费用为8.59(百万元),每年综合治理量为1.39?g/m3,专项治理量为8.01?g/m3,此时的满意度为90% 。
3
一、问题重述
1.1 问题背景
空气,我们每天都呼吸着的“生命气体”,它的质量直接关乎着人类的生产、生活和生存。因此,空气质量问题的监测、预报和控制等问题是全国人民关注的重点。
2012年环境保护部公布的《环境空气质量标准》,增设了PM2.5和臭氧8小时平均浓度限值;调整了原有指标的浓度限值;并试行了AQI作为空气质量监测指标的规定。该规定中,首次将产生灰霾的主要因素PM2.5的浓度指标列入空气质量监测指标中。 1.2 问题重述
PM2.5的来源有自然源和人为源,主要成分由水溶性离子、颗粒有机物和微量元素等组成。其形成机理和过程比较复杂,而且进入公众视线的时间很短,所以关于细颗粒物PM2.5的数据相对较少,对于细颗粒物PM2.5的客观规律也了解不够。因此,我们利用现有数据研究以下问题。 1.2.1 PM2.5的相关因素分析
AQI监测指标为:二氧化硫SO2、二氧化氮NO2、可吸入颗粒物PM10、细颗粒物PM2.5、臭氧O3和一氧化碳CO等6 项。有研究表明,二氧化硫SO2、二氧化氮NO2和一氧化碳CO是可能形成PM2.5的气态物体,请根据附件1或附件2中数据或自行采集数据,利用或建立适当的数学模型对AQI中的6个基本监测指标的相关与独立性进行定量分析,尤其是对其中PM2.5(含量)与其它5项分指标及其对应污染物(含量)之间的相关性及其关系进行分析。如果你们进而发现AQI基本监测指标以外的、与PM2.5强相关的(可监测的)成分要素,请陈述你们的方法、定量分析结果、数据及来源。 1.2.2 PM2.5的分布与演变及应急处理
请依据附件2、附件3中的数据或自行采集某地区的数据,通过数学建模探索完成以下研究:
1、描述该地区内PM2.5的时空分布及其规律,并结合环境保护部新修订的《环境空气质量标准》分区进行污染评估。
2、建立能够刻画该地区PM2.5的发生和演变(扩散与衰减等)规律的数学模型,合理考虑风力、湿度等天气和季节因素的影响,并利用该地区的数据进行定量与定性分析。
3、假设该地区某监测点处的PM2.5的浓度突然增至数倍,且延续数小时,请建立针对这种突发情形的污染扩散预测与评估方法。并以该地区PM2.5监测数据最高的一天为例,在全地区PM2.5浓度最高点处的浓度增至2倍,持续2小时,利用你们的模型进行预测评估,给出重度污染和可能安全区域。
4、采用适当方法检验你们模型和方法的合理性,并根据已有研究成果探索PM2.5 的成因、演变等一般性规律。 1.2.3 空气质量的控制管理
4
数据1所在地区的环境保护部门考虑治污达标的紧迫性和可行性,在未来五年内,拟采取综合治理和专项治理相结合的逐年达到治理目标的方案。请考虑以下问题:
1、该地区目前PM2.5的年平均浓度估计为280(单位为?g/m3),要求未来五年内逐年减少PM2.5的年平均浓度,最终达到年终平均浓度统计指标35(单位为?g/m3),请给出合理的治理计划,即给出每年的全年年终平均治理指标。
2、据估算,综合治理费用,每减少一个PM2.5浓度单位,当年需投入一个费用单位(百万元),专项治理投入费用是当年所减少 PM2.5浓度平方的0.005倍(百万元)。请你为数据1所在地区设计有效的专项治理计划,使得既达到预定PM2.5减排计划,同时使经费投入较为合理,要求你给出五年投入总经费和逐年经费投入预算计划,并论述该方案的合理性。
二、问题分析
2.1 问题一的分析
对于问题一,可以分为两个小问:首先要定量分析AQI中6个检测指标之间的相关性和独立性;其次主要分析PM2.5的浓度指标与另外5个分指标之间的相关性。
针对第一小问,附件1给出的大量数据,不可避免的会出现数据缺失和异常值,数据缺失会对相关性分析有一定影响,所以首先需要对数据进行预处理,剔除缺失值。在分析各指标相关性时,个别异常值对于相关性分析影响不大,所以暂时不作剔除。第一小问,定量分析6项指标之间相关性时。由于各个指标的标准不同,首先利用MATLAB对数据进行归一化处理,然后再利用SPSS处理得到Pearson相关系数来衡量各个指标之间的关系强度。然后根据大样本数据需要满足正态性原则,即剔除不满足统计学规律,远离数据正态分布所对应的位置的点和浮动范围脱离总体的点。最后根据第一小问得出的相关性定量关系,检验由于不满足正态原则而剔除的数据是否合理。
针对第二小问,要求建立分析PM2.5和其5项指标的相关性模型,本文将PM2.5作为因变量,其它指标作为自变量,利用第一小问预处理后的数据,建立多元线性回归方程,从而得到PM2.5值与其余5项分指标的相关方程。 2.2 问题二的分析
针对问题二第一小问,需要综合时间和空间分析PM2.5的分布状况,而时空分布图是一个四维图,不便于绘制,所以本文将时空分布图分为时间分布图和空间分布图分别建立模型进行分析。首先建立PM2.5与SO2、NO2、PM10的三元线性回归方程来估计数据2中PM2.5中缺失的2010年1月到2012年12月的数据得到PM2.5的时间分布图,然后建立关于PM2.5的二维插值模型得到了关于各地区的空间分布图。最后根据《环境空气质量标准》建立了模糊综合评价模型,并根据最大隶属度原则对13个地区的污染程度进行评估。
针对问题二第二小问,够刻画该地区PM2.5的发生和演变的数学模型并考虑风力、湿度等天气和季节因素,并利用该地的数据进行定性与定量的分析。因此本文建立了不同季节下关于风力、湿度、温度的三元线性回归模型,并建立高斯点源扩散模型分析其扩散与衰减现象。
针对问题二第三小题,在第二小问的基础,建立了针对此突发情况的基于高斯点源函数的污染扩散预测二维插值模型,并找出了全地区最高浓度PM2.5的一
5