2013年美国数学建模竞赛论文C题论文

2019-02-20 20:09

基于主成分-有向复杂网络的地球健康的评价及动态预测

摘要

地球是一个庞大而复杂的生态系统，评价并预测其健康状况一直是一个难题。本文建立了分析各国家（节点）健康状况的主成分分析模型；基于生态系统的复杂性，进一步构建了一个反映各节点间交互影响的有向复杂网络模型；进而采用灰色预测模型对地球健康状况进行动态预测。

计算每个节点的健康指数。因为地球上的国家较多和地球健康指数影响指标较多，本文选取21个国家作为分析地球的节点、11个地球健康指标。采用主成分分析法对21个节点以及全球的11个指标进行综合分析，把11个指标抽象成5个主成分进行健康指数的求解。我们以2000年的进行验证，结果显示五个主成分的累积贡献率高达92%，结果可靠。我们同时对各个节点的综合值Z（健康指数）进行排名，排名靠前的是美国、澳大利亚、加拿大等发达国家，排名靠后的是Morocco、Egypt Arab Rep. China、Kenya等发展中国家且生态保护较差的国家。

分析节点间的交互影响。建立有向复杂网络来考虑各节点间的相互影响，选取8个典型国家来构成类似生物圈的“小世界”，用8个国家节点的健康指数进行逐步回归来确定网络的边和权重。在考察网络的基本特征参数后，通过边的权重来求得各节点的权重值。最后我们用修正后的网络加权模型和主成分分析模型结果对比，二者相互验证，说明模型的合理性。最后将模型推广到地球生态系统。

未来地球健康状况的动态预测。我采用灰色预测中的GM（1,1）模型对世界的健康指数进行10年的动态预测，预测结果的相对误差小于5%，预测精度较高。预测的十年结果见表11。

对于模型的预警，我们通过给定健康指数的最低值a作为临界点，把GM（1,1）预测的结果与a比较，小于a则就警报。对于a的确定可以查找本文中11个指标的限定，通过限定值确定a的大小。对于政策的影响，我们选取中国和世界的人口增长率为对象进行了分析，证明政策对地球生态有一定的潜在影响。

关键词健康指数有向复杂网络主成分分析逐步回归动态预测

一、问题重述

本题目要求建立一个全球网络，该网络一方面能建立一个全球模型来改进生物预测，这个模型要能反映由于地球上各系统间的交叉影响而带来的复杂性，以及地区条件和全球系统之间的相互影响，指明如何有效使用生态系统管理来防止或减少这些迫近的变化，并为政策制定者提供建议。同时，尽管许多警示性的信号已经出现，但没人知道地球是否已经在全球范围内逼近了临界点，以及这样一个极端的状态是否是不可避免的，题目要求我们建立的模型能预测生态健康的临界点，并为阻止达到这个临界点提供意见。

要求1：通过确定影响地球健康某一方面的本土因素，即网络节点，分析其关系和属性，通过恰当的方式将这些节点连起来，在此基础上建立一个动态的全球网络模型。明确定义模型中的所有要素并且解释你在建模过程中界定网络建构考量因素、节点实体和链接特性的科学依据。

要求2：要求预测未来的地球健康，并通过数据进行验证、评估。同时注意模型中是否有人为因素，该模型是否能预测地球状态的变化或临界点。还要求出本地发生变化时引起的全球的变化。

要求3：所建立的模型能识别网络中的关键点，并且在节点缺失时能感知，有一定的灵敏度，能在全球的生态健康方面发挥预警作用。

要求4：拟定一篇20页的报告（不包括总结页）来解释所建的模型与其应用前景。确保指出模型的优点和缺点。

二、模型假设

1 所查到的数据真实可靠。

2 所使用的11个因素涵盖了影响生态系统健康的所有方面。

3 在预测的时间段内，世界不会发生极大影响生态系统健康的突发性事件。 4 对于部分缺失的数据，所填补是公平合理的，不影响总体。 5 模型基于的规则是完全公平的。

6 模型建立的过程中所有选择的国家都是具有代表性的，可以带表整体的特性。

三、符号说明

符号 Z xij xij p Zij R Ci Ki B，Y a 注：部分未说明的符号在模型会给与介绍。

含义健康指数标准化后指标值指标的取值主成分数标准化后的健康值相关系数矩阵聚类系数节点i的邻接点数据矩阵健康指数的临界值四、问题分析

根据对题目的分析，我们知道题目要求我们考虑地球上各系统间的交叉影响

的复杂性及地区条件和全球系统之间的影响，建立一个动态的全球网络模型，明确节点的实体和节点间的链接特性，根据地区条件变化引起全球变化提供预警，并能预测未来地球健康状况的变化，为政策制定者提供有效的政策。针对问题，以国家为节点，根据生态学选取地球健康因子,在世界银行数据库中查得所需的数据。

具体分析思路如下：

（1）根据所查的数据求出各个节点及世界的健康指数。可以通过主成分分析法对所取20年的数据进行综合评价；

（2）接着，求解各节点间的影响及内部的相互作用。在主成分分析的基础上，因为数据量较大，在21个国家中挑选出8个国家来构成“小世界”作为真实世界的模拟。对于选出来的8个国家，将他们构成有向复杂网络来考虑各节点间的影响及内部的相互作用。

（3）对未来健康状况的预测。根据全球1991年到2010年的健康指数，以20年的数据为基础，采用GM（1,1）进行预测，并提出预警情况。

五、模型的建立与求解

5.1 节点和指标的选取（1）节点的选取

考虑地理位置和国家发展状况，选取了21个典型的国家，这21个国家可以代表全球。选取的21个国家：Argentina，Australia，Brazil，Canada，China，Egypt，Arab Rep.，France，Germany，Iran，Islamic Rep.，Israel，Italy，Japan，Kazakhstan，Kenya ，Morocco，New Zealand，Russian Federation，Saudi，Arabia，South Africa United，Kingdom，United States。（2）指标的选取[1,2]

地球是一个大生态系统，我们根据文献[3]选取了11个地球健康的指标，如下表所示：

表1 地球健康指标城镇人口比重（%）社会因素人均耕地面积（公顷）高等院校入学率（%）经济因素人均GDP（美元）每千美元的能源消耗量（千克石油当量）地球健康 CO2排放量（人均公吨数）环境因素颗粒污染程度（每立方米微克）人均能源使用量（千克石油当量）人口密度（每平方公里）人的因素人口增长（%）五岁以下婴儿死亡率（%）选取21个国家11个指标的时间区间:[1991-2010]年；数据的来源:世界银行数据库[4]

5.2 主成分分析模型的建立与求解 5.2.1主成分分析法的步骤

1）对原始数据进行标准化处理

假设进行主成分分析的指标变量有m个：x1,x2,???,xm，共有n个评价对象，第i个评价对象的第 j 个指标的取值为xij。将各指标值xij 转换成标准化指标

xij,

xij?xij?xjsj,(i?1,2,???,n;j?1,2,???,m)

21n1n其中，xj??xij,sj?(xij?xj),(j?1,2,???,m) ?ni?1n?1i?1即，xj,sj为第 j 个指标的样本均值和样本标准差。对应地，称

xi?xi?xi,(i?1,2,???,m)为标准化指标变量。 sj2）计算相关系数矩阵 R