系。 2.
. Correlations
消耗量 1950年每百万男1930年人均香烟子中死于肺癌的人数 1 .737 .010 11 .737 .010 11 11 ****1930年人均香烟消耗量 Pearson Correlation Sig. (2-tailed) N 11 1 1950年每百万男子中死于肺癌的人数 Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). 散点图如上图所示。
由上表可知,Pearson相关系数为0.737,说明香烟消耗量与肺癌死亡率之间存在显著的相关关系。 3.
Correlations Control Variables 家庭收入(元) 销售额(万元) Correlation Significance (2-tailed) df 销售价格(元) Correlation Significance (2-tailed) df 销售额(万元) 销售价格(元) 1.000 . 0 -.728 .026 7 -.728 .026 7 1.000 . 0
散点图如上图所示。
如果所绘的图形不能较清晰地展示变量之间的关系,则应先对数据进行调整,剔除极端值,再绘图。 由上述销售额与销售价格之间相关关系的表格可知,在家庭收入作为控制变量的条件下,销售额与销售
价格间的偏相关系数为-0.728,呈较强的线性相关关系。
第十一章
i?12.(1)从变量共同度的计算公式可以看出,除了国家预算内基金和国内贷款共同度较低(0.196、0.769),
其余变量的变量共同度都比较高(都大于0.8,分别为0.821、0.920、0.821)。可见,所提取的因子能够反映原有变量的大部分信息,仅有少部分信息丢失,因子分析效果一般。
s??ai12215(2)利用因子方差贡献的计算公式,可以计算出因子1的方差贡献率为0.7054。可见因子1方差贡献率一般,说明因子的重要性也不高。 (3)
3.(1)根据因子载荷矩阵提出的数据,计算出身高、坐高、体重、胸围、肩宽、骨盆宽的变量共同度分别为:0.915、0.885、0.871、0.453、0.681、0.754。可见,胸围、肩宽的变量共同度较低,其余变量的共同度相对较高1.说明所提取的因子能够反映原有变量的大部分信息,仅有少部分信息丢失,因子分析效果较好。
(2)计算得出,因子1、2的因子方差贡献率分别为:0.529、0.749, (3)?
(4)从旋转后的因子载荷矩阵可以看出,身高、坐高、体重、胸围在第一个因子上有较高的载荷,第一个因子主要解释了这几个变量,可解释为,肩宽、盆骨宽在第二个因子上有较高的载荷,第二个因子主要解释了这几个变量,可解释为
4. 因子分析的变量共同度(一) Communalities ffff 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .196 .769 .820 .920 .821 Extraction Method: Principal Component Analysis. 从结果可知,利用外资、自筹资金、其他投资等变量的绝大多数信息(大于82%)可被因子解释,这些变量的信息丢失较少;但国内贷款这个变量的变量共同度仅为0.769,不是很高,而国家预算内资金这个变量的信息丢失较严重。因此,此次因子提取的总体效果并不理想。 (若重新指定两个因子,则因子载荷矩阵为 因子分析的变量共同度(二) Communalities 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .975 .795 .860 .937 .882 Communalities 国家预算内资金 国内贷款 利用外资 自筹资金 其他投资 Initial 1.000 1.000 1.000 1.000 1.000 Extraction .975 .795 .860 .937 .882 Extraction Method: Principal Component Analysis. 当指定提取2个特征值时,此时的变量共同度都较高,各个变量的信息丢失都较少,因此,本次因子提取效果较理想。 (2) Component Matrix a 自筹资金 其他投资 利用外资 国内贷款 国家预算内资金 Component 1 .959 .906 .906 .877 .443 2 -.132 -.247 -.199 .160 .882 Extraction Method: Principal Component Analysis. a. 2 components extracted. Rotated Component Matrix a 自筹资金 其他投资 利用外资 国内贷款 国家预算内资金 Component 1 .949 .937 .921 .775 .128 2 .190 .064 .110 .440 .979 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. 从因子载荷矩阵可见,等四个变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度高,第一个因子很重要;第二个因子与自筹资金、其他投资、利用外资、国内贷款等四个变量的相关性均较小,只与国家预算资金的相关性较大,第二个因子对于国家预算资金很重要。旋转后的因子载荷矩阵也有这个特点 第十章
1.(1)第1步:1号样本(广西瑶族)和三号样本(广西侗族)聚成一小类,它们的个体距离是3.722,这个小类将在
下面第2步用到;
第2步:8号样本(贵州苗族)和第1步聚成的小类又聚成一类它们的距离是9.97,这个小类将在下面的第4步
用到;
第3步: 5号样本(崩龙族)和7号样本(白族)聚成一小类,它们的个体距离是11.556,这个小类将在下面
第5步用到;
第4步: 6号样本(基诺族)和第2步聚成的小类又聚成一类,它们的个体距离是18.607,这个小类将在下面
第6步用到;
第5步: 4号样本(土家族)和第3步聚成的小类又聚成一类,它们的个体距离是20.337,这个小类将在下面
第6步用到;
第6步: 第4步聚成的小类和第5步聚成的小类又聚成一类,它们的个体间距离是22.262,这个小类将在下面
第7步用到;
第7步: 2号样本(湖南侗族)和第6步聚成的小类又聚成一类,它们的个体间距离是31.020。
(3) 从冰挂图可见,如果分成三类,第1类是:湖南侗族;第2类是:白族、崩龙族、土家族;第3类是:基诺族、
贵州苗族、广西侗族、广西瑶族。
碎石图353025201510500.002.(1)
系列1B0.501.00A1.502.002.50从碎石图可以看出,随着
类的不断凝聚,类数目的不断减少,类间的距离在逐渐增大,在聚成4类之前,类间距离增大的幅度较小,形成“极为陡峭的山峰”,但到4类后,类间的距离迅速增大,形成“平坦的碎石”。根据类间距离小形成类的相似性大,距离大形成类的相似性小的原理,在本例中,可以聚成4类或者5类。
(2)根据树形图可见,如果聚成4类,则第一类为北京;第二类为江苏;第三类为上海、广东、湖北、辽宁、浙江、
湖南、山东;其余为第四类。
如果聚成5类,则第一类为北京;第二类为江苏;第三类为上海、广东、湖北;第四类为辽宁、
浙江、湖南、山东;其余为第四类。
(3) (4) 第九章
5、从结果可知,利用向后筛选策略共经过两步完成回归方程的建立,最终模型为第二个模型。从方程建立的过程看,
剔除的变量是粮食播种面积。如果显著性水平?为0.05,可以看到被剔除变量的偏F检验的概率P-值大于显著性水平,因此不能拒绝检验的原假设,这个变量的偏回归系数与零无显著差异,它对被解释变量的线性解释没有显著贡献,不因该保留在方程中。最终保留在方程中的变量是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。选用这个模型后,由于回归方程和各回归系数的显著性检验的概率P-值小于显著性水平?=0.05,因此被解释变量与所有解释变量之间的线性关系显著,以及被解释变量与各个解释变量之间的线性关系显著。方程的DW检验值为1.284,残差存在一定程度的正相关,但是标准化残差的非参数检验结果表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。所以影响粮食总产量的主要因素是农业劳动者人数、总播种面积、风灾面积比例、施用化肥量。
7.利用spss曲线估计方法,做出各个模型估计结果,以判定系数为主要依据选择模型,最终选择了三次曲线模型。对
粮食产量进行外推预测,1987、1988、1989年的粮食总产量分别为30630.008、30864.092、31093.650.计算得到平均预测误差为: