《概率论与数理统计B》实验教学指导书(4)

2020-02-20 15:19

④样本数据的箱形图

箱形图可以比较清晰地表示数据的分布特征，它由 5个部分组成：

1) 箱形上、下的横线为样本的 25%和 75%分位数，箱形顶部和底部的差值为内四分位极值；

2) 箱形中间的横线为样本的中值，若该横线没在箱形中央，则说明存在偏度， 3) 箱形向上或向下延伸的直线称为“触须”，若没有异常值，样本的最大值为上触须的顶部，样本最小值为下触须的底部，默认情况下，距离箱形顶部或底部大于1.5倍内四分位极值的值称为异常值；

4) 图中顶部的加号表示该处数据为一异常值，该值的异常可能是输入错误、测量失误或系统误差引起；

5) 箱形两侧的“V”形槽口对应于样本中值的置信区间. 默认情况下，箱形图没有“V”形槽口，

调用格式：

boxplot(X) % 产生矩阵 X 的每一列的箱形图和“触须”图, “触须”从箱形末端延伸出来, 表示数据向极大和极小方向延伸的程度. 如果“触须”的外面没有数据, 则在“触须”的底部有一个点.

·boxplot(X, notch) %当notch=1时, 产生一个带刻槽的箱形图. 默认时 notch=0, 产生一个矩形箱形图.

boxplot(X, notch, 'sym') %sym表示图形颜色和符号, 默认值为蓝色和“+”. ·boxplot(X, notch, 'sym', vert) %当 vert=0 时, 生成水平箱形图; vert=1 时, 生成竖直箱形图(默认值 vert=1).

·boxplot(X, notch, 'sym', vert, whis) %whis 定义“触须”图的长度. 若 whis=0, 则

boxplot 函数通过绘制 sym符号图来显示箱形图以外的数据值. 六、实验结果

例10. 产生100个均值为5, 标准差为1的正态分布的随机数, 再产生100个均值为 6, 标准差为 1 的正态分布的随机数, 用箱形图比较它们均值大小.

解：在命令窗口中输入:

x1 = normrnd(5, 1, 100, 1); x2 = normrnd(6, 1, 100, 1);

x = [x1 x2]; %形成 100 行2 列正态分布的随机数. boxplot(x, 1, 'g+', 1, 0) %产生矩阵X的每一列的箱形图和“触须”图. 回车后显示(见图 6):

图2-3 两个正态样本的箱形图比较

七、注意事项

要求学生爱护电脑，不能损坏电脑及其他实验室设备。每次开机电脑会更新，要提醒学生把自己做的数据分析结果保存在自己的U盘或其他移动设备上。八、实验报告的格式以及内容要求 1、给出下列各题的程序和计算结果

①产生 100 个标准正态分布的随机数，指出它们的分布特征，并画出经验累计分布函数图；

②产生 100 个均值为 1，标准差为 1 的正态分布的随机数，画出它们的直方图并附加正态密度曲线，观察它们之间的拟合程度；

③产生 100 个均匀分布的随机数，对这 100 个数据的列向量，用加号“*”标注其数据位置，作最小二乘拟合直线；

④产生100个参数为5的指数分布的随机数，再产生100个参数为1的指数分布的随

机数，用箱形图比较它们均值不确定性的稳健性。

⑤课后作业（请自行输入题目）

P261. 1题，3题；P279. 1题；P282. 35，36；

2、实验报告的格式：纸张大小为A4纸；页边距为上：3cm；下：2.5 cm；左：3cm; 右3 cm；整篇段落格式设定为1.5倍行距，段前，段后均为0，标点用全角；正文用宋体小四号字体；标题用黑体小四号。九、思考题

如何用help命令学习常见函数的应用十、考核方式及评定标准

考核方式以提交的实验报告为主，参考实验课上同学们解决问题的情况而定。评定标准分为：A、B、C、D四个等级，其中A为优秀，B为良好，C为中等，D为较差。

实验三正态分布的参数估计及假设检验

一、实验目的

掌握参数估计和假设检验的 MATLAB 的有关命令。二、实验内容及要求

1、掌握参数估计和假设检验的 MATLAB 的有关命令； 2、熟练掌握单个正态总体期望和方差的区间估计；

3、熟练掌握两个正态总体期望差和方差比的区间估计的命令； 4、熟练掌握对单个正态总体均值、方差的假设检验； 5、掌握对两个正态总体均值、方差有关的假设检验； 6、对统计结果能进行正确的分析。三、实验的重点和难点

实验的重点和难点是要求学生掌握基本的MATLAB软件的编程语言，掌握基本的调用命令。四、实验准备

掌握假设检验的相关步骤；

(1) 根据问题提出合理的原假设H0和备择假设；

(2) 给定显著性水平?, 一般取较小的正数, 如0.05,0.01等； (3) 选取合适的检验统计量及确定拒绝域的形式； (4) 令P{当H0为真拒绝H0}??, 求拒绝域；

(5) 由样本观察值计算检验统计量的值, 并做出决策: 拒绝H0或接受H0. 五、实验步骤

下面是MATLAB软件提供的一些常用的参数估计函数命令. 一、矩估计

命令：mu_ju=mean(X) % 返回样本X的均值

sigma2_ju =moment(X,2) % 返回样本X的2阶中心矩例1. 来自某总体X的样本值如下：

232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30，求X的均值与方差的矩估计。

解：x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30];

mu_ju=mean(X)

sigma2_ju= moment(X,2) 输出：mu_ju = 232.4025

sigma2_ju =

0.0255

二、单个总体极大似然估计与区间估计（参数均未知）

命令1: [a,b]=namefit (X, ALPHA) % 返回总体参数的极大似然估计a与置信度为100(1- ALPHA)%.的置信区间，若参数为多个，ab也是多个，若省略ALPHA，置信度为0.95

常用分布的参数估计函数

表3-1 参数估计函数表

函数名调用形式函数说明二项分布的概率的最大似然估计 PHAT= binofit(X, N) binofit [PHAT, PCI] = binofit(X,N) [PHAT, PCI]= binofit (X, N, ALPHA) 置信度为95%的参数估计和置信区间返回水平α的参数估计和置信区间泊松分布的参数的最大似然估计 Lambdahat=poissfit(X) poissfit [Lambdahat, Lambdaci] = poissfit(X) [Lambdahat,Lambdaci]=poissfit(X, ALPHA) 置信度为95%的参数估计和置信区间返回水平α的λ参数和置信区间正态分布的最大似然估计，置信度[muhat,sigmahat,muci,sigmaci] = normfit(X) normfit [muhat,sigmahat,muci,sigmaci]=normfit(X, ALPHA) 为95% 返回水平α的期望、方差值和置信区间返回β分布参数a和 b的最大似然betafit PHAT =betafit (X) [PHAT, PCI]= betafit (X, ALPHA) 估计返回最大似然估计值和水平α的置信区间 [ahat,bhat] = unifit(X) unifit [ahat,bhat,ACI,BCI] = unifit(X) [ahat,bhat,ACI,BCI]=unifit(X, ALPHA) 均匀分布参数的最大似然估计置信度为95%的参数估计和置信区间 2

共9页:

《概率论与数理统计B》实验教学指导书(4).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档