统计案例分析(4)

2019-03-03 11:05

稍逊于使用二次模型。二次模型具有显著的二次项以及较高的调整的R平方。因此改用二次模型再次进行拟合。 ln brain weight 与 ln body weight 的回归汇总报告Y: ln brain weightX: ln body weight二次模型的拟合线图Y = 2.449 + 0.7715 X - 0.01766 X**2Y 和 X 之间存在关系吗?7.5是P = 0.000ln brain weight 和 ln body weight 之间的关系具有显著的统计意义 (p < 0.05)。否ln brain weight00.050.1> 0.55.02.50.0-50ln body weight注释模型所解释的变异 %00%用于描述 Y 和 X 之间关系的二次模型的拟合方程是: Y = 2.449 + 0.7715 X - 0.01766 X**2如果此模型与数据拟合得很好,可使用此方程预测 ln bodyweight 的值为 ln brain weight,或查找对应于 ln brainweight 的所需值或值范围的 ln body weight 的设置。 关系具有显著的统计意义并不表示 X 导致 Y。5 R-sq(调整)= 93.40%ln brain weight 中 93.40% 的变异可能是由回归模型导致的。 ln brain weight 与 ln body weight 的回归模型选择报告Y: ln brain weightX: ln body weight二次模型的拟合线图Y = 2.449 + 0.7715 X - 0.01766 X**28残差大异常 Xln brain weight6420-5.0统计量-2.50.02.5ln body weight5.07.5 R 平方(已调整)P 值,模型P 值,线性项P 值,二次项P 值,立方项残差标准差* 具有显著的统计意义 (p < 0.05) 选定的模型二次93.40%0.000*0.000*0.005*-0.558备择模型线性立方92.90?.41%0.000*0.000*0.000*0.000*-0.580-0.2800.5790.557 -14-

尝试添加ln body weight的二次项,重新对数据集进行回归分析。 回归分析:ln brain wei 与 gestation pe, av. Litter s, ln body weig, ln bw sq 回归方程为 ln brain weight = 2.52 + 0.00338 gestation period (days) - 0.112 av. Litter size + 0.659 ln body weight - 0.0239 ln bw sq 自变量 系数 系数标准误 T P 常量 2.5162 0.1551 16.23 0.000 gestation period (days) 0.0033810 0.0008390 4.03 0.000 av. Litter size -0.11154 0.03623 -3.08 0.003 ln body weight 0.65875 0.02706 24.35 0.000 ln bw sq -0.023883 0.005878 -4.06 0.000 S = 0.452819 R-Sq = 95.8% R-Sq(调整) = 95.7% 方差分析 来源 自由度 SS MS F P 回归 4 429.15 107.29 523.24 0.000 残差误差 91 18.66 0.21 合计 95 447.81 来源 自由度 Seq SS gestation period (days) 1 291.10 av. Litter size 1 11.05 ln body weight 1 123.62 ln bw sq 1 3.38 异常观测值 gestation period ln brain 拟合值 标准化 观测值 (days) weight 拟合值 标准误 残差 残差 24 270 7.1701 5.6512 0.0741 1.5189 3.40R 46 67 1.4540 2.4326 0.0669 -0.9786 -2.19R 52 360 7.3778 6.3499 0.1110 1.0279 2.34R 72 655 8.4074 8.3432 0.2775 0.0642 0.18 X 75 390 5.5215 6.5993 0.1246 -1.0778 -2.48R 77 115 5.1930 4.8116 0.2173 0.3814 0.96 X 78 240 6.3801 6.7348 0.1926 -0.3547 -0.87 X R 表示此观测值含有大的标准化残差 -15-

X 表示受 X 值影响很大的观测值。 ln brain weight 残差正态图和残差与拟合值图 正态概率图(响应为 ln brain weight)99.99995908070605040302010510.1百分比-1.5-1.0-0.50.0残差0.51.01.5 与拟合值(响应为 ln brain weight)1.51.00.5残差0.0-0.5-1.0024拟合值68

数据分析:

受Minitab拟合建议的启发,尝试添加了一个二次项后,我们可以看到新增加的二次项的

-16-

P-值为0.000。这说明,二次项在回归模型里还是有一定意义的。从上图中可以看到调整的R平方进一步提高到95.7%。也就是说模型对变异的解释能力进一步提高。在进行回归分析的最后,我们在Minitab中加入了计算数据Cook距离的步骤。希望通过考察目前模型的观测值的Cook距离,判断是否存在对模型有强烈影响但是不太合理的点。目前,含有大的标准化残差的观测值数量是4个,影响点的数量是3个。

3.4 对Cook距离的分析

当前观测值的Cook距离的统计如下,可以看到最大Cook距离为0.1。此Cook距离为数据第75个观测值造成的,对应的哺乳动物是貘。其次是人类和海豚,Cook距离在0.06到0.07之间。但是根据Cook距离>1的经验准则,并不需要关注有影响观测值的存在问题。所以,目前的数据基本上是合理的,满足分析要求的,不需要对数据进行额外的调整。

Cook 距离1 的时间序列图0.100.08Cook 距离10.060.040.020.0011020304050指数60708090 -17-

三、总结

通过以上的统计分析,我们发现哺乳动物大脑的重量与其体重、妊娠期天数、平均每窝产仔数量存在着一定的关系。而生物学界通常认为,动物的大脑是否发达和脑重量也存在一定的关系,因此我们可以通过对动物体重、妊娠期天数、平均每窝产仔数量等显性数据的观察,来进一步分析动物的大脑发达程度。在此基础上,我们可以更好的认识动物的认知与活动规律。

在经济生活中,此研究也具有重大的意义,例如马戏团可以利用此研究结果来选取大脑发达的动物进行驯化,以获得更好的效果。虽然此研究是建立在生物学研究的基础之上,但其结论对于马戏团、动物园等商业场所如何提高经济效益,也很具有指导性,具有可观的商业价值。

此外,随着科学技术的发达,通过改变基因来改变物种特性,创造新的物种,也具有现实可能性。因此,科研人员可以通过对体重、妊娠期天数、平均每窝产仔数量等变量的控制,改良培育出实验所需要的大脑发达水平的物种。

-18-


统计案例分析(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:苏教版四年级下册语文期末测试题及答案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: