5. (习题3.3)绘出习题3.1的茎叶图、箱线图,并计算五数总括。
注意:以上图形的颜色自行定义。
源代码: >stem(w)
> boxplot(w,col=\>fivenum(w)
运行截图:
6. (习题3.4)分别用W检验方法和Kolmogorov-Smirnov检验方法检验习题3.1的
数据是否服从正态分布。
源代码:
>shapiro.test(w)
> ks.test(w,\运行截图:
结论:
正态性W检验得出P值为0.6708>0.05,因此,认为样本来自正态分布的总体。
经验分布的检验:P>0.05,可认为来自正态分布总体。有警告信息是因为数据有重复数值,ks检验要求待检数据时连续的,不被重复的。
思考:
1. 统计分析包括哪两个方面的分析?
统计描述和统计推断
2. 描述集中趋势的统计量有哪些?
均值,众数,百分位数,中位数等 3. 描述分散程度的统计量有哪些?
方差,标准差,极差,四分位极差,变异系数和标准误差等 4. 描述分布形状的统计量有哪些?
偏度系数和峰度系数
5. 标准差刻画的是样本值与样本均值的偏离程度,标准误刻画的是样本均值与_____
的偏离程度。
样本
6. lapply()函数和sapply()函数有什么异同点?
异:lapply()函数输出列表;sapply()函数输出向量 同:作用于向量或列表的数据集合上(数据框)
7. R中每一个分布都对应有四个函数,以正态分布norm为例,请写出它对应的4个
函数,并简要说明每个函数的作用。
dnorm()的返回值是正态分布的概率密度函数 pnorm()的返回值是正态分布的分布函数 qnorm()的返回值是给定概率p后的下分位点
rnorm()的返回值是n个正态分布随机数构成的向量 8. QQ图有什么作用?
QQ图可以帮助我们鉴别样本的分布是否近似于某种类型分布 9. 箱线图中,箱的底部,中部和顶部分别表示什么?
在箱线图中,上(Q3)下(Q1)四分位点分别确定出中间箱体的顶部和底部,箱体中间的粗线是中位数(me)所在位置
10. 在R中,如果想在一个输出窗口里放2行3列共6张图,需要运行什么命令? > par(mfrow=c(2,3))
三、实验小结(必写,但字数不限)
这次实验主要是数据分布,统计描述通过绘制图(直方图、茎叶图、箱线图等)对数据进行分析,还需要进行正态w和分布ks进行检验是否服从正态分布,进行五数的总括,最能反应数据重要特征。掌握统计描述是非常重要的,因为是数据分析的基础。学会进行密度估计曲线与正态密度曲线相比较,经验分布曲线与正态分布曲线相比较。