统计案例分析

2019-03-03 11:05

哺乳动物大脑发育水平相关因素回归分析

小组成员:

目录

一、 数据来源及背景 ............................................................................................................... 1

1. 数据来源 ....................................................................................................................... 1 2. 数据背景及研究目的 ................................................................................................... 1 3. 数据说明 ....................................................................................................................... 1 二、 统计分析 ........................................................................................................................... 1

1. 数据描述性分析 ........................................................................................................... 1

1.1 数据基本描述 ............................................................................................................ 1 1.2 置信区间分析 ............................................................................................................ 2 1.3 brain weight与body weight的数据相关性 .............................................................. 2 1.4 所有参数的相关性 .................................................................................................... 3 2. 数据图形化分析 ........................................................................................................... 3 3. 多元回归分析 ............................................................................................................... 5

3.1 原始数据直接多元回归分析 .................................................................................... 5 3.2 对多元回归原始数据处理和调整 ............................................................................ 8 3.3 数据模型的确定 ...................................................................................................... 12 3.4 对Cook距离的分析 ............................................................................................... 17

三、总结......................................................................................................................................... 18 附录:研究数据 ............................................................................................................................. 19

统计案例分析

一、数据来源及背景 1. 数据来源

数据来源于American Naturalist (1974)杂志 p.593-613.

2. 数据背景及研究目的

达尔文在他的《进化论》一书中指出“生物之间存在着生存斗争,适应者生存下来,不适者则被淘汰,这就是自然的选择。生物正是通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。”从达尔文的观点中我们可以得出动物具备使它们自身更好的生存和繁衍后代的能力,这是一种内在的属性。有一种观点认为,具备更大大脑容量的动物,比如哺乳动物在生存和繁衍方面一般会表现得更好。虽然,哺乳动物的自然选择有一些限制,比如他们通常需要更长的怀孕期并且一次孕育后代的数量更少。这些负面因素在一定程度上削弱了哺乳动物的优势。但是总体来说,哺乳动物的优势要大于它们的劣势。通常情况下,较大的大脑意味着躯体也更加的硕大。我们尝试用统计的方法,研究和分析一下具备更大大脑容量的哺乳动物之间具有什么样相同和不同的特征,在这些特征中是否会存在某些特别突出的因素。众所周知,哺乳动物是动物发展史上最高级的阶段,也是与人类关系最密切的一个类群。我们希望通过此次的论证和研究,能够得到关于一些哺乳动物大脑重量的信息,并找到与之相关联的因素,为促进哺乳动物大脑重量的研究提供可以参考的依据。 3. 数据说明

我们小组分析的案例,是研究哺乳动物大脑重量和其他几种因素的关系。这些因素主要包括哺乳动物的妊娠期天数、身体重量以及平均每窝产仔数量。数据总共采集了96种不同哺乳动物的信息。当模型具有显著的统计意义并且样本足够大(n=96)时,可以获得比较准确的估计值。 Excel列示如下: Problem: Correlates of brain size Nature of data : A B C D E Name of the species Gestation period (days) Brain weight (gms) Body weight (kg) Litter size 物种名称 妊娠期天数 大脑重量 身体重量 平均每窝产仔数量

二、统计分析

1. 数据描述性分析 1.1 数据基本描述

我们对所采用的数据首先进行了简单的描述性分析,具体信息见下图。

描述性统计: gestation period, brain weight, body weight, av. Litter size 均值标 下四分 变量 N N* 均值 准误 标准差 最小值 位数 中位数 gestation period (days) 96 0 151.3 11.0 108.1 16.0 63.0 133.5 brain weight (gms) 96 0 219.0 51.7 507.0 0.5 12.2 74.0 -1-

body weight (kg) 96 0 108.3 33.6 329.4 0.0 2.0 8.9 av. Litter size 96 0 2.310 0.178 1.747 1.000 1.000 1.200 上四分 变量 位数 最大值 gestation period (days) 228.8 655.0 brain weight (gms) 260.0 4480.0 body weight (kg) 98.3 2800.0 av. Litter size 3.400 8.000 从上图的描述性分析初步可知,哺乳动物的平均怀孕期为151天,平均大脑重量为219毫克,平均体重108公斤,平均每次产仔数量为2.3。

1.2 置信区间分析 单样本 T: gestation period, brain weight (gm, body weight (kg), av. Litter size 均值标 变量 N 均值 标准差 准误 95% 置信区间 gestation period (days) 96 151.3 108.1 11.0 (129.4, 173.2) brain weight (gms) 96 219.0 507.0 51.7 (116.3, 321.7) body weight (kg) 96 108.3 329.4 33.6 ( 41.6, 175.1) av. Litter size 96 2.310 1.747 0.178 (1.956, 2.664) 对数据置信区间的分析使我们得知了:

对数据gestation period,样本均值为151.3,标准误11.0,由此构造的区间(129.4, 173.2)有95%包括gestation period总体均值。

对数据brain weight,样本均值为219.0,标准误51.7,由此构造的区间(116.3, 321.7)有95%包括brain weight总体均值。

对数据body weight,样本均值为108.3,标准误33.6,由此构造的区间(41.6, 175.1)有95%包括body weight总体均值。

对数据av. Litter size,样本均值为2.310,标准误0.178,由此构造的区间(1.956, 2.664)有95%包括av. Litter size总体均值。

1.3 brain weight与body weight的数据相关性 相关: brain weight (gms), body weight (kg) brain weight (gms) 和 body weight (kg) 的 Pearson 相关系数 = 0.864 P 值 = 0.000 根据结果显示,哺乳动物的大脑重量和躯体重量是有非常强的相关性的。但是对brain weight取对数后,ln brain weight和body weight之间的相关性减弱。而ln brain weight和ln body weight之间的相关性最强。这也为后面进行回归分析提供了一个思路。 相关: ln brain weight, body weight (kg) -2-

ln brain weight 和 body weight (kg) 的 Pearson 相关系数 = 0.422 P 值 = 0.000 相关: ln brain weight, ln body weight ln brain weight 和 ln body weight 的 Pearson 相关系数 = 0.964 P 值 = 0.000

1.4 所有参数的相关性 相关: gestation period, brain weight (gm), body weight (kg), av. Litter size gestation period brain weight (gm) body weight (kg) brain weight (gm) 0.728 0.000 body weight (kg) 0.625 0.864 0.000 0.000 av. Litter size -0.604 -0.255 -0.183 0.000 0.012 0.075 单元格内容: Pearson 相关系数 P 值 对brain weight和body weight取对数以后的整体相关性分析,可以粗略的看到,数据之间的相关性更加紧密,整体感觉好于之前的分析。

相关: gestation period (days), av. Litter size, ln brain weight, ln body weight gestation period av. Litter size ln brain weight av. Litter size -0.604 0.000 ln brain weight 0.806 -0.612 0.000 0.000 ln body weight 0.772 -0.513 0.964 0.000 0.000 0.000 单元格内容: Pearson 相关系数 P 值

2. 数据图形化分析

这里,我们分别观察了brain weight和body weight的散点图,以及ln brain weight和ln body weight的散点图。从第一张图上可以看到,绝大多数哺乳动物集中在图的左下角,也就是体重小于500公斤,大脑重量小于1000毫克的范围里。哺乳动物的体重变化范围还是相对较大的,下图中最大的体重是非洲象,体重2800公斤同时其大脑重量也达到了4480毫克,其次

-3-


统计案例分析.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:苏教版四年级下册语文期末测试题及答案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: