概率论与数理统计实验指导书
改变分布函数类型. 移动滚动条或在参数名右方的编辑框中输入数值, 可以改变参数的设置. 在滚动条的顶部或底部编辑框中输入数值, 可以改变参数的上下界设置.
在“Sample”(即“样本”按钮)编辑框中输入数值, 可以改变样本容量的大小. 完成上面的操作后, 单击右上方的“关闭”按钮, 关闭图形用户界面.
例3-5 用随机数生成工具箱, 生成正态分布随机数和均匀分布随机数的直方图.
解 在命令窗口输入: randtool 命令, 打开随机数生成界面, 如图3-1所示. 在“Distribution”下拉式列表框中进行选择, 确定生成什么分布的随机数. 在“Samples”窗口中输入样本的大小. 在图形下方输入对应分布的参数及其上下界区间. 单击“Resample”按钮, 生成随机数并用直方图表示.
在“Distribution”下拉式列表框中选择“Uniform”选项, 将生成服从均匀分布的随机数. 如图3-2 所示.
图3-1正态分布的随机数的直方图图 3-2 均匀分布的随机数的直方图
三、 实验结论与总结
产生各种随机数, 是我们进行科学试验经常使用的一种试验手段和方法, 通过产生满足某些条件的随机数, 画出它们的散点图, 利用概率统计的方法, 可以分析随机数分布的规律, 进而找寻事物本身隐含的关系, 或者验证理论结果的正确性.
四、 实验习题
1. 产生区间(-1, 1 )上的12个连续型与离散型的均匀分布随机数. 2. 产生 12(要求 3行 4 列)个标准正态分布随机数. 3. 产生 20个λ=1 的指数分布随机数.
4. 产生 32(要求 4行 8 列)个参数 λ=3 的泊松分布随机数.
5. 用函数 “random”分别产生 20 (要求 4行 5 列)个均值为 10, 标准差为 6 的正态分布随机数和20 个均匀分布随机数.
6.利用随机数生成工具箱, 生成二项分布、泊松分布、指数分布和 F 分 布的随机数的直方图.
31
概率论与数理统计实验指导书
实验四 统计图及概率密度与分布函数作图的综合性实验
一、 实验问题 1. 问题背景
对实验数据进行处理,其中包括数据统计作图,是我们在学习和工作以及科研中必须经常进行的一项几何上的分析方法. 通过对实验数据的统计图形分析, 我们可以观察或发现一些随机事件(或随机变量)的性质. 利用概率密度函数图形和分布函数图形, 我们可以观察或发现一些随机事件(或随机变量)的规律.
本实验学习一些经常使用的统计数据的作图命令, 掌握这些作图命令将会帮助读者大大提高进行实验数据处理和作图分析的能力.
2. 实验目的与要求
(1) 熟练掌握MATLAB软件的关于统计作图的基本操作; (2) 会进行常用的概率密度函数和分布函数的作图; (3) 会用命令计算概率, 画出分布律图形;
(4) 会操作交互式经验分布函数和概率密度函数图形的工具箱; (5) 会在图形中标注文字, 填充颜色等操作; (6) 提高观察实验现象或处理数据方面的能力.
二、实验操作过程 1.常用统计图 (1) 直方图
根据实验数据, 绘出直方图, 来显示数据的分布特征, 进而观察实验数据所反映的统计规律.
调用格式:
·n = hist(Y) % n = hist(Y)将 Y中的元素分到 10个间隔相同的条形中, 并返回每个条形中元素的个数. 若Y是矩阵, 则hist函数对每一列生成直方图.
·n = hist(Y, x) % n = hist(Y, x)中 x 为向量, 返回 Y的分布. 如, 若 x为 一个 5 元素向量, 则 hist 函数将 Y中的元素分配到五组分组中.
·n = hist(Y, nbins) % n = hist(Y, nbins)中 nbins 为标量, 使用 nbins 组条形. ·[n, xout] = hist(?) %[n, xout] = hist(?)返回包含频数和条形位置的向量n和xout. 可以使用 bar(xout, n)来绘直方图.
· hist(?) %无输出变量的 hist 函数创建一个上面描述的直方图输出. hist 函数在 y 的最小值和最大值之间沿x 分配条形.
Y向量或Y矩阵某列中所有元素根据它们的数值范围进行分组. 每一个组用一组条形表示.
直方图的x轴反映Y中值的范围. 直方图的y轴显示落到组中的元素个数; 所以, 在任意条形组中, y轴包括 0到最大元素个数的范围.
直方图用添加阴影的图形对象创建. 若希望改变图形颜色, 可以设置阴影属性.
例 4-1 创建服从正态分布的数据的钟形直方图, 设置图形颜色, 使得条形为红色, 条形的边为白色.
解 在命令窗口中输入:
x =-2.9 : 0.1 : 2.9;
y = randn(10000, 1); %生成10000 个正态分布的随机数. hist(y, x)
32
概率论与数理统计实验指导书
h = findobj(gca, 'type', 'patch'); % gca 表示获得当前图形窗口内当前坐标轴的句柄值.“句柄”, 每个图形对象都用一个数字来标识, 这个数字叫“句柄”.
set(h, 'FaceColor', 'r', 'EdgeColor', 'w') %设置条形颜色和边框颜色.
回车后显示图 4-1所示.
图4-1 正态分布的随机数的直方图
(2) 经验累积分布函数图形 基本数学原理: 设是总体X的一个容量为n的样本观察值. 先按自小到大的次序排列, 并重新编号, 设为
记
则 Fn(x)叫做总体 X 的经验累积分布函数.
调用格式:
·cdfplot(X) % 作样本 X(向量)的累积分布函数图形. ·h = cdfplot(X) %h表示曲线的句柄.
·[h,stats] = cdfplot(X) %stats 表示样本的一些特征:样本最小值、最大值、平均值、中位数和标准差.
例 4-2 产生 50 个标准正态分布的随机数, 指出它们的分布特征, 并画出经验累计分布函数图(输出图见4-2).
解 在命令窗口中输入:
X=normrnd (0,1,50,1); % 产生 50×1 标准正态分布的随机数,用命令 normrnd (0,1,1,50) 也可以, 这时产生 1×50 标准正态分布的随机数.
[h,stats]=cdfplot(X)
回车后显示:
h =
33
概率论与数理统计实验指导书
152.0016 stats =
min: -2.1707 % 样本最小值. max: 2.1832 % 样本最大值. mean: 0.0393 % 样本平均值. median: 0.1196 % 样本中位数. std: 0.9760 % 样本标准差.
图 4-2 经验累积分布函数图形
(3) 最小二乘拟合直线 基本数学原理:在一元线性回归中有两个变量, 其中x是可观测、可控制的普通变量, Y为随机变量. Y与x之间存在如下关系:
通常认为
且假设
与x 无关. 记 y=E(Y), 则y= a+bx就是所谓的一元线性回归
函数, 其图像就是回归直线, b 为回归系数, a 称为回归常数, 有时也通称a,b为回归系数.
根据观测值(xi, yi)(i=1, 2, ?, n)估计模型中回归函数 y=a+bx中的回归系数:
分别称为a, b的最小二乘估计值. 式中
称
为经验回归(直线方程), 或经验公式.
调用格式:
·lsline % 最小二乘拟合直线. ·h = lsline % h为直线的句柄.
34
概率论与数理统计实验指导书
例 4-3 对有 10 个数据的列向量, 用加号“+”标注其数据位置, 作最小二乘拟合直线(拟合图见 4-3).
解 在命令窗口中输入:
X = [2 3.4 5.6 8 11 12.3 13.8 16 18.8 19.9]'; plot(X,'+') %横坐标为 1, 2, ?, 10, 产生数据分布图. lsline %在上图中作最小二乘拟合直线.
回车后显示:
图 4-3 数据分布图与最小二乘拟合直线
(4) 绘制正态分布概率图形——判断总体或样本是否服从正态分布
如果数据来自正态分布, 则正态分布概率图形显示为直线, 而其它分布可能在图中产生弯曲.
调用格式:
·normplot(X) % 若 X 为向量, 则显示正态分布概率图形, 若X为矩阵, 则显示每一列的正态分布概率图形; 样本数据在图中用加号“+”显示.
·h = normplot(X) %返回绘图直线的句柄.
例 4-4 产生 50 个标准正态分布的随机数和指数分布的随机数, 并画出它们的正态分布概率图形(分别可见图 4-4, 图 4-5).
解 在命令窗口中输入:
X=normrnd(0, 1, 1, 50); % 产生50 个标准正态分布的随机数. Y=exprnd(1, 1, 50); % 产生50个参数是1的指数分布的随机数. normplot(X) % 标准正态分布的随机数及其拟和直线. normplot(Y) % 指数分布的随机数及其拟和直线.
35