全国数学建模大赛2012C题(3)

2020-02-21 13:33

Ei???k?1pi?1ik ?i?1,2,?,p,k?1,2,...,m,m?p? (10)

??i(7)确定主成分的数目m. 方法有:①一般取累计贡献率达85%—95%的主成分; ②选用所有?i?1的主成分;③累计特征值乘积大于1的主成分;④画出特征值变化曲线,以转折点位置为标准判断.本文采用累计贡献率达85%—95%的主成分.

(8)确定主成分函数表达式模型. 设m个主成分对应的特征向量分别为

A1、A2、、...Am,其中Aj??a1j主成分yj的函数表达式为

a2j...apj?,akj表示Aj的第k行的元素,则第j个

T?x1???x2?T?yj??Aj??a?...??1j??x???p?a2j?x1???px2??...apj??akjxk (11) ?...??k?1???x??p?(9)提炼主成分yj的抽象意义.由xk与yj的相关系数bkj的大小可以确定yj主要与哪几个变量显著相关,然后根据这几个变量的实际意义提炼yj的抽象意义.

(10)检验主成分模型.根据n个样本的m个主成分的函数值,通过计算m个主成分y1,y2,...,ym的相关系数就可以检验m个主成分是否线性无关.如果两个主成分的相关系数为0,则说明这两个主成分线性无关,模型有效;否则线性相关,模型无效.

(11)求主成分函数值。将各样本标准化数据xk代入(7),可以求得各样本的第

j个主成分yj的函数值.

4)模型求解

(1)收集原始数据矩阵X.

本文选取了某地区的月平均气压的平均值、月最高气压的平均值、月最低气压的平均值、月平均气温的平均值、月最高气温的平均值、月平均气压的平均值8项指标,并分别记为x1,x2??x8. 每个指标有48个数据(见附件1)。

使用SPSS软件进行求解(见附录7)。

(2)将原始数据标准化,(SPSS内部计算).

(3)求原始数据的相关系数矩阵R,如图7所示.

11

图7 相关系数矩阵

图8因子分析检验图

从图8看出,表格的第一行为检验变量间偏相关程度的KMO统计量,其值在0.6之上才适合做主成分分析,效果显著,如果小于0.6,效果不显著,不适合做主成分分析。下面的三行为球形检验的结果,球形检验原假设的变量是不相关的,显然只有拒绝原假设的情况下数据才适合做因子分析。本例中KMO值为0.720,球形检验显著,两个条件都满足,变量间相关程度大,适合做因子分析。

(4)计算矩阵R的特征根、各因子的方差贡献率及累计方差贡献率,并确定主成分的个数.如图9所示。

图9 R特征值及其累计方差贡献率

从图9中可以看出,第一、第二主成分对方差的累计贡献率达到95.461%,它们分别对应着原样本数据点数据变异的最大、次大方向,是原变量系统的一个最佳整合,从而我们可以以95.461%的精度将变量的有效维数从8维降至2维.因此可以将前2个因子作为主因子.

(5)确定主成分函数表达式模型,因子得分系数矩阵如图10所示.

12

图10 因子得分系数矩阵

设2个主成分分别为y1,y2,则建立模型为

?y1??0.184x1?0.183x2?0.185x3?0.175x4?0.186x5?0.164x6?0.096x7?0.121x8 (12) ??y2?0.048x1?0.042x2?0.057x3?0.020x4?0.055x5?0.015x6?0.536x7?0.567x8 其中x1,x2,??x8.均为原变量经过均值为0,方差为1标准化后的变量. (6)对主成分y1,y2的意义进行解释。图11给出了原变量与第1、第2主成分的相关系数.

图11 旋转后的因子载荷矩阵

第一主成分y1,与原变量x1(平均气压的平均值)、x2(最高气压的平均值)x3(最低气压的平均值)、x6(最低气温的平均值)的相关系数的绝对值都超过了0.948,因此它是一个反映气温和气压的综合因子,我们称之为气压温度因子.

第二主成分y2,与原变量x7(月平均相对湿度的平均值)的相关系数为0.925、

x8(月最低相对湿度的平均值)的相关系数为0.948,其余的都不超过0.266,因此它是一个反映相对湿度的因子,称为湿度因子. (7)计算2个主成分的函数值.

将48个经过标准化的数据xi*代入模型yj,可以得到48个地区的主成分yj的函数

13

值,结果如表1所示.

表1 48个月对应的主成分函数值 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 y1 -1.6817 y2 0.5485 z 487 528 784 858 1082 1137 1043 1080 1206 1265 1202 1297 1209 1716 1787 1598 1755 1533 2078 1322 1384 1331 1475 1472 序号 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 y1 -1.121 y2 1.77 z 946 799 739 861 855 788 752 962 828 769 667 623 841 1280 1671 1553 1715 1618 1621 1716 1647 1709 1615 1719 -1.601 -0.061 -0.675 0.0076 0.1144 -0.917 0.9219 -2.098 1.3417 0.0584 1.3521 0.4715 0.9402 1.6644 0.3575 1.5115 0.2595 -0.727 -1.091 1.1667 -1.331 0.3153 -1.453 0.2577 -1.083 0.8107 -0.823 0.1507 -0.401 -0.076 0.7358 -0.659 0.7824 0.7099 1.2455 0.6445 1.3537 -0.133 0.5816 0.9467 -0.246 0.4312 -0.531 -0.633 -0.593 -1.472 -0.7683 -0.2082 -0.4507 -0.2166 0.152 0.9259 1.5239 0.5675 -0.1318 -1.1893 -1.5909 0.7554 0.2097 1.0055 0.192 0.5304 1.1598 -1.7758 1.5284 -0.4272 -0.6524 -0.9464 -1.5177 -0.4902 -1.3599 -1.3556 -0.1654 -2.0187 0.1845 0.6764 1.1459 0.5359 -0.1899 -0.9077 -1.03 1.8659 0.7356 1.1416 0.9149 0.5766 0.9955 -1.3149 1.6182 -0.2525 -1.036 -0.9904

(8)检验主成分模型.

由于主成分分析的4个条件中的前3个(每一个主成分都是各原始变量的线性组合;主成分的数目大大少于原始变量的数目;主成分保留了原始变量的绝大多数信息),只要检验4个主成分是否相关即可.

由步骤(7)计算的2个主成分的得分矩阵Y??yij?48?2,求矩阵Y的协方差矩阵如图12所示.

14

图12 因子得分的协方差矩阵

从图12可以看出,主成分得分的协方差矩阵为单位矩阵,说明提取的2个主成分是互不相关的.满足假设的条件,模型和结果有效. 5.2.2多元非线性回归分析[4]

将48个月的发病率作为因变量,记作z,将发病率的48个数据填入表1中。下面寻找发病率z与主成分y1,y2的关系式,这需要使用多元非线性回归分析方法。

经过反复试验探索,找到的非线性回归模型为

??aya4y2az?exp?a1y1?a2y2?31??5?a6? (13)

y1?y2y1(1?y2)y1??其中,a1?0.1281,a2??0.0472,a3?0.0273,a4?0.0021,a5??0.0407,a6?7.0361。

模型检验的p?0.0399?0.05,说明模型有效。平均绝对相对误差为26.38%。

5.2.3结果分析

1)从非线性回归模型(12)可以得到以下结论:

(1)由a1?0可得,发病率与气压温度因子具有正相关性; (2)由a2?0可得,发病率与湿度因子具有负相关性;

(3)由a1?a2可得,气压温度因子比湿度因子对于发病率的影响显著; 2)从主成分模型(11)可以得到以下结论: 由第1个方程可知:

(1)由x1,x2,x3的系数为负值可得,气压温度因子与月平均气压、月平均最高气压、月平均最低气压具有负相关性;

(2)由x4,x5,x6的系数为正值可得,气压温度因子与月平均温度、月平均最高温度、月平均最低温度具有正相关性;

(3)由x7,x8的系数为负值可得,气压温度因子与月平均相对湿度、月平均最低相对湿度具有负相关性; 由第2个方程可知:

(4)由x1,x2,x3的系数为正值可得,湿度因子与月平均气压、月平均最高气压、月平均最低气压具有正相关性;

(5)由x4?0,x5?0,x6?0可得,湿度因子与月平均温度、月平均最高温度成负相关性,与月平均最低温度具有正相关性;

(6)由x7,x8的系数为正值可得,湿度因子与月平均相对湿度、月平均最低相对湿度具有正相关性;

15


全国数学建模大赛2012C题(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:文化产业调研报告

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: