6、学生身高与体重的五线总括分别为图11、图12 图11 图12 解析: 在探索数据分析中,反应数据重要特征的5个数分别是中位数me,下四分位数Q1,上四分位数Q3,最小值min和最大值max;从结果可看出,年龄的最小值min,Q1,me,Q3,max分别为:11.0 12.0 13.0 14.5 16.0;身高的为:51.30 58.25 62.80 65.90 72.00;体重的为: 50.50 84.25 99.50 112.25 150.00 三、身高与体重的统计量分析 1、表3.9数据框的生成 (文件名:student_data.R) 程序代码: # 将表3.9中学生的年龄、身高和体重构成数据框 df<-data.frame( Age=c(13, 13, 14, 12, 12, 15, 11, 15, 14, 14, 14, 15, 12, 13, 12, 16, 12, 11, 15 ), Height=c(56.5, 65.3, 64.3, 56.3, 59.8, 66.5, 51.3, 62.5, 62.8, 69.0, 63.5, 67.0, 57.3, 62.5, 59.0, 72.0, 64.8, 57.5, 66.5), Weight=c( 84.0, 98.0, 90.0, 77.0, 84.5, 112.0, 50.5, 112.5, 102.5, 112.5, 102.5, 133.0, 83.0, 84.0, 99.5, 150.0, 128.0, 85.0, 112.0) ); 10
2、R软件的绘图命令对表3.9的使用 (1)plot函数 年龄、身高及体重的箱线图如图13: 程序代码: y<-c(13, 13, 14, 12, 12, 15, 11, 15, 14, 14, 14, 15, 12, 13, 12, 16, 12, 11, 15, 56.5, 65.3, 64.3, 56.3, 59.8, 66.5, 51.3, 62.5, 62.8, 69.0, 63.5, 67.0, 57.3, 62.5, 59.0, 72.0, 64.8, 57.5, 66.5,84.0, 98.0, 90.0, 77.0, 84.5, 112.0, 50.5, 112.5, 102.5, 112.5, 102.5, 133.0, 83.0, 84.0, 99.5, 150.0, 128.0, 85.0, 112.0) f<-factor(c(rep(1,19),rep(2,19),rep(3,19))) plot(f,y) 图13 11
#plot函数的使用 plot(df) #绘出图形如图14 attach(df) plot(~Age+Height) # 绘出身高与年龄的散点图图15 plot(Weight~Age+Height)#绘出两张散点图,第一张是体重与年龄图16 ,第二张是体重与身高 图17 pairs(df) #绘出关于矩阵各列的散点图 图18 coplot(Weight ~ Height | Age) #绘出按年龄段给出的体重与身高的散点图 图19 图14 图15 图16
12 图17 图18 图19 分析: (df) 绘图如图(14)所示;plot(~Age+Height) 绘出身高与年龄的散点图(图15);plot(Weight~Age+Height)绘出两张散点图(图16),第一张为体重与年龄,第二张为体重与身高(图17);pairs(df) 绘出关于矩阵各列的散点图(图18) coplot(Weight ~ Height | Age) 绘出按年龄段的体重与身高散点图(图19)。 13
3、 作年龄、身高及体重之间的相关性检验(图20) 代码: cor.test(~X1+X2,data=X) cor.test(~X1+X3,data=X) cor.test(~X2+X3,data=X) #Student.data中的数据,并计算均值、协方差和相关矩阵;其中X1表示年龄,X2表示身高,X3表示体重 程序结果为: 图20 分析可看出: 1) X1与X2的P值为 2.48e-05<0.05, 且从相关系数区间(0.4320777,0.8941859)可看出认为变量X1与X2相关,即学生年龄与身高相关; 2) X1与X3的P值为 0.0002848<0.05, 认为变量X1与X3相关,即学生年龄与体重相关; 3)X2与X3的P值为 7.887e-07<0.05, 且从相关系数区间为(0.7044314 ,0.9523101)看出认为变量X2与X3相关,即学生身高与体重相关; 综上知,学生年龄,身高,体重皆两两相关。 14