④样本数据的箱形图
箱形图可以比较清晰地表示数据的分布特征,它由 5个部分组成:
1) 箱形上、下的横线为样本的 25%和 75%分位数,箱形顶部和底部的差值为内四分位极值;
2) 箱形中间的横线为样本的中值,若该横线没在箱形中央,则说明存在偏度, 3) 箱形向上或向下延伸的直线称为“触须”,若没有异常值,样本的最大值为上触须的顶部,样本最小值为下触须的底部,默认情况下,距离箱形顶部或底部大于1.5倍内四分位极值的值称为异常值;
4) 图中顶部的加号表示该处数据为一异常值,该值的异常可能是输入错误、测量失误或系统误差引起;
5) 箱形两侧的“V”形槽口对应于样本中值的置信区间. 默认情况下,箱形图没有“V”形槽口,
调用格式:
boxplot(X) % 产生矩阵 X 的每一列的箱形图和“触须”图, “触须”从箱形末端延伸出来, 表示数据向极大和极小方向延伸的程度. 如果“触须”的外面没有数据, 则在“触须”的底部有一个点.
·boxplot(X, notch) %当notch=1时, 产生一个带刻槽的箱形图. 默认时 notch=0, 产生一个矩形箱形图.
boxplot(X, notch, 'sym') %sym表示图形颜色和符号, 默认值为蓝色和“+”. ·boxplot(X, notch, 'sym', vert) %当 vert=0 时, 生成水平箱形图; vert=1 时, 生成竖直箱形图(默认值 vert=1).
·boxplot(X, notch, 'sym', vert, whis) %whis 定义“触须”图的长度. 若 whis=0, 则
2
boxplot 函数通过绘制 sym符号图来显示箱形图以外的数据值. 六、实验结果
例10. 产生100个均值为5, 标准差为1的正态分布的随机数, 再产生100个均值为 6, 标准差为 1 的正态分布的随机数, 用箱形图比较它们均值大小.
解:在命令窗口中输入:
x1 = normrnd(5, 1, 100, 1); x2 = normrnd(6, 1, 100, 1);
x = [x1 x2]; %形成 100 行2 列正态分布的随机数. boxplot(x, 1, 'g+', 1, 0) %产生矩阵X的每一列的箱形图和“触须”图. 回车后显示(见图 6):
图2-3 两个正态样本的箱形图比较
七、注意事项
要求学生爱护电脑,不能损坏电脑及其他实验室设备。每次开机电脑会更新,要提醒学生把自己做的数据分析结果保存在自己的U盘或其他移动设备上。 八、实验报告的格式以及内容要求 1、给出下列各题的程序和计算结果
①产生 100 个标准正态分布的随机数,指出它们的分布特征,并画出经验累计分布函数图;
②产生 100 个均值为 1,标准差为 1 的正态分布的随机数,画出它们的直方图并附加正态密度曲线,观察它们之间的拟合程度;
③产生 100 个均匀分布的随机数,对这 100 个数据的列向量,用加号“*”标注其数据位置,作最小二乘拟合直线;
④产生100个参数为5的指数分布的随机数,再产生100个参数为1的指数分布的随
2
机数,用箱形图比较它们均值不确定性的稳健性。
⑤课后作业(请自行输入题目)
P261. 1题,3题;P279. 1题;P282. 35,36;
2、 实验报告的格式:纸张大小为A4纸;页边距为上:3cm;下:2.5 cm;左:3cm; 右3 cm;整篇段落格式设定为1.5倍行距,段前,段后均为0,标点用全角;正文用宋体小四号字体;标题用黑体小四号。 九、思考题
如何用help命令学习常见函数的应用 十、考核方式及评定标准
考核方式以提交的实验报告为主,参考实验课上同学们解决问题的情况而定。 评定标准分为:A、B、C、D四个等级,其中A为优秀,B为良好,C为中等,D为较差。
2
实验三 正态分布的参数估计及假设检验
一、实验目的
掌握参数估计和假设检验的 MATLAB 的有关命令。 二、实验内容及要求
1、掌握参数估计和假设检验的 MATLAB 的有关命令; 2、熟练掌握单个正态总体期望和方差的区间估计;
3、熟练掌握两个正态总体期望差和方差比的区间估计的命令; 4、熟练掌握对单个正态总体均值、方差的假设检验; 5、掌握对两个正态总体均值、方差有关的假设检验; 6、对统计结果能进行正确的分析。 三、实验的重点和难点
实验的重点和难点是要求学生掌握基本的MATLAB软件的编程语言,掌握基本的调用命令。 四、实验准备
掌握假设检验的相关步骤;
(1) 根据问题提出合理的原假设H0和备择假设;
(2) 给定显著性水平?, 一般取较小的正数, 如0.05,0.01等; (3) 选取合适的检验统计量及确定拒绝域的形式; (4) 令P{当H0为真拒绝H0}??, 求拒绝域;
(5) 由样本观察值计算检验统计量的值, 并做出决策: 拒绝H0或接受H0. 五、实验步骤
下面是MATLAB软件提供的一些常用的参数估计函数命令. 一、矩估计
命令:mu_ju=mean(X) % 返回样本X的均值
sigma2_ju =moment(X,2) % 返回样本X的2阶中心矩 例1. 来自某总体X的样本值如下:
232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30,求X的均值与方差的矩估计。
解:x=[232.50, 232.48, 232.15, 232.52, 232.53, 232.30, 232.48, 232.05, 232.45, 232.60, 232.47, 232.30];
mu_ju=mean(X)
2
sigma2_ju= moment(X,2) 输出:mu_ju = 232.4025
sigma2_ju =
0.0255
二、单个总体极大似然估计与区间估计(参数均未知)
命令1: [a,b]=namefit (X, ALPHA) % 返回总体参数的极大似然估计a与置信度为100(1- ALPHA)%.的置信区间,若参数为多个,ab也是多个,若省略ALPHA,置信度为0.95
常用分布的参数估计函数
表3-1 参数估计函数表
函数名 调 用 形 式 函 数 说 明 二项分布的概率的最大似然估计 PHAT= binofit(X, N) binofit [PHAT, PCI] = binofit(X,N) [PHAT, PCI]= binofit (X, N, ALPHA) 置信度为95%的参数估计和置信区间 返回水平α的参数估计和置信区间 泊松分布的参数的最大似然估计 Lambdahat=poissfit(X) poissfit [Lambdahat, Lambdaci] = poissfit(X) [Lambdahat,Lambdaci]=poissfit(X, ALPHA) 置信度为95%的参数估计和置信区间 返回水平α的λ参数和置信区间 正态分布的最大似然估计,置信度[muhat,sigmahat,muci,sigmaci] = normfit(X) normfit [muhat,sigmahat,muci,sigmaci]=normfit(X, ALPHA) 为95% 返回水平α的期望、方差值和置信区间 返回β分布参数a和 b的最大似然betafit PHAT =betafit (X) [PHAT, PCI]= betafit (X, ALPHA) 估计 返回最大似然估计值和水平α的置信区间 [ahat,bhat] = unifit(X) unifit [ahat,bhat,ACI,BCI] = unifit(X) [ahat,bhat,ACI,BCI]=unifit(X, ALPHA) 均匀分布参数的最大似然估计 置信度为95%的参数估计和置信区间 2