是河马体重1400公斤。相对于体重,脑容量更重的两个物种则是人类和海豚。海豚的脑重量达到了1600毫克。 brain weight (gms) 与 body weight (kg) 的散点图50004000brain weight (gms)30002000100000500100015002000body weight (kg)25003000 ln brain weight 与 ln body weight 的散点图8ln brain weight6420-5.0-2.50.02.5ln body weight5.07.5 我们还尝试使用箱线图的方式对四种变量进行简单的探索性数据分析,以便更直观的看到几种数据的分布概况。
-4-
gestation pe, body weight , av. Litter s, brain weight 的箱线图gestation period (days)60045030010001500av. Litter size84000642030002000100000brain weight (gms)20003000body weight (kg) 3. 多元回归分析
3.1 原始数据直接多元回归分析
我们以大脑重量为因变量,其他3种数据作为自变量,直接进行回归分析。回归结果如下: 回归分析:brain weight 与 gestation period, body weight, av. Litter size 回归方程为 brain weight (gms) = - 225 + 1.81 gestation period (days) + 0.986 body weight(kg) + 27.6 av. Litter size 自变量 系数 系数标准误 T P 常量 -225.29 83.06 -2.71 0.008 gestation period (days) 1.8087 0.3544 5.10 0.000 body weight(kg) 0.98588 0.09428 10.46 0.000 av. Litter size 27.65 17.41 1.59 0.116 S = 224.561 R-Sq = 81.0% R-Sq(调整) = 80.4% 方差分析 来源 自由度 SS MS F P 回归 3 19777225 6592408 130.73 0.000 残差误差 92 4639349 50428 合计 95 24416574 -5-
来源 自由度 Seq SS gestation period (days) 1 12947201 body weight(kg) 1 6702907 av. Litter size 1 127117 异常观测值 gestation brain period weight 拟合值 标准化 观测值 (days) (gms) 拟合值 标准误 残差 残差 24 270 1300.0 354.8 42.1 945.2 4.29R 40 21 2.4 34.2 82.2 -31.8 -0.15 X 52 360 1600.0 611.2 63.1 988.8 4.59R 72 655 4480.0 3747.5 190.5 732.5 6.16RX 75 390 250.0 734.5 69.0 -484.5 -2.27R 77 115 180.0 391.2 92.7 -211.2 -1.03 X 78 240 590.0 1616.7 112.5 -1026.7 -5.28RX R 表示此观测值含有大的标准化残差 X 表示受 X 值影响很大的观测值。
数据分析:
?H0:??0根据假设检验的定义来初步分析一下回归结果,假设检验:?
H:??0?a从回归方程上分析,常数项,gestation period和body weight的P-值很小,说明可以明显
拒绝原假设H0。但是av. litter size的P-值为0.116,不能拒绝原假设。因此,对数据的回归分析还需要进一步的分析和验证。
Brain weight残差正态图和残差与拟合值图如下:
-6-
正态概率图(响应为 brain weight (gms))99.99995908070605040302010510.1百分比-1000-5000残差5001000 与拟合值(响应为 brain weight (gms))1000500残差0-500-1000010002000拟合值30004000
数据分析:
从残差的正态分布图和残差与拟合值图分析,明显可以看到残差和正态分布拟合的不好,具有异方差的特性,是非常数方差。因此,初始的设置对数据进行直接回归分析是不恰当的。考虑采用其他模型来重新进行回归分析。
-7-
3.2 对多元回归原始数据处理和调整
考虑到残差图的形状,为了消除异方差的影响,我们对brain weight取对数,并再一次进行回归分析: 回归分析:ln brain wei 与 gestation pe, body weight , av. Litter s 回归方程为 ln brain weight = 2.13 + 0.0151 gestation period (days) - 0.000519 body weight (kg) - 0.215 av. Litter size 自变量 系数 系数标准误 T P 常量 2.1350 0.4630 4.61 0.000 gestation period (days) 0.015089 0.001976 7.64 0.000 body weight (kg) -0.0005191 0.0005255 -0.99 0.326 av. Litter size -0.21492 0.09706 -2.21 0.029 S = 1.25167 R-Sq = 67.8% R-Sq(调整) = 66.8% 方差分析 来源 自由度 SS MS F P 回归 3 303.68 101.23 64.61 0.000 残差误差 92 144.14 1.57 合计 95 447.81 来源 自由度 Seq SS gestation period (days) 1 291.10 body weight (kg) 1 4.90 av. Litter size 1 7.68 异常观测值 gestation period ln brain 拟合值 标准化 观测值 (days) weight 拟合值 标准误 残差 残差 4 51 0.131 2.582 0.259 -2.451 -2.00R 40 21 0.867 0.732 0.458 0.135 0.12 X 66 108 5.561 3.026 0.158 2.534 2.04R 67 104 5.710 2.950 0.169 2.760 2.23R 72 655 8.407 10.350 1.062 -1.943 -2.93RX 77 115 5.193 2.052 0.517 3.141 2.75RX 78 240 6.380 4.815 0.627 1.565 1.45 X -8-