抽样分布的研究(2)

2019-06-17 18:17

抽样分布的研究

1、两个样本均值差异的抽样分布

若从总体X1和总体X2中分别独立地抽取容量为n1和n2的样本,则由两个样本均值之差 x1?x2的所有可能取值形成的概率分布称为两个样本均值差异的抽样分布.

设总体X1和总体X2的均值分别为?1和?2,标准差分别为?1和?2,则两个样本均值之差x1?x2的抽样分布可概括为以下两种情况: (1)若总体X1N?μ1,?1?,总体X22N(μ2,σ)x1?x2222σ1σ2?2) N(μ1?μ2, nn(2)若两个总体都是非正态总体,当两个样本容量n1和n2都足够大时,依据中心极限定理,x1和x2分别近似服从正态分布,则 x1?x22、两个样本比例差异的抽样分布 2σ1σ2?2) N(μ1?μ2, nn若从总体X1和总体X2中分别独立地抽取容量为n1和n2的样本,则由两个样本比例之差p1?p2的所有可能取值形成的概率分布,称为两个样本比例差异的抽样分布. 3.3 抽样分布的几个定理

(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即E(x) = μ,(E为平均的符号,x为样本的平均数,μ为总体的平均数). (2)容量为n的样本平均数在抽样分布上的标准差,等于总体标准差除以n的方根,?即?x?(?x为平均数抽样分布的标准差,?为总体标准差,n为样本容量). n (3)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布. (4)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布. 第6页(共33页)

抽样分布的研究

3.4 抽样分布、样本分布和总体分布

统计中用随机变量X的取值范围及其取值概率的序列来描述这个随机变量,称

之为随机变量X的概率分布.如果我们知道随机变量X的取值范围及其取值概率的序列,就可以用某种函数来表述X取值小于某个值的概率,即为分布函数:

F?X??P?X?z?.

例如,一个由N家工业企业组成的总体,X为销售收入.将总体所有企业的销售收入按大小顺序排队,累计出总体中销售收入小于某值x的企业数量并除以总体企业总数N,就可得到总体中销售收入小于x的企业的频率,也即抽取一个销售收入小于

x的企业的概率.此频率或概率随着x值不同而变化形成一个序列,形成了销售收入X的概率分布.

3.4.1 总体分布是在总体中X的取值范围及其概率

样本分布是在样本中X的取值范围及其概率.上例中,如果抽取n个企业作为样本,我们同样可以用这n个销售收入的取值范围及其概率描述其分布,也即样本分布.样本分布也称为经验分布,随着样本容量n的逐渐增大,样本分布逐渐接近总体分布.抽样分布是指样本统计量的概率分布??.采用同样的抽样方法和同等的样本量,

4从同一个总体中可以抽取出许许多多不同的样本,每个样本计算出的样本统计量的值也是不同的.样本统计量也是随机变量,抽样分布则是样本统计量的取值范围及其概率.仍以工业企业为例,我们设计了一个抽样方案并确定了样本量,这时可能抽取的样本是众多的,每抽取一个样本就可以计算出一个企业平均销售收入,所有可能形成的分布就是抽样分布.例中,样本统计量为随机变量,抽样分布是的概率分布.研究概率分布对于抽样调查是十分重要的,因为只有知道概率分布,才能够利用抽样技术推断抽样误差.现实中,总体的分布状况通常是未知的,但我们也无需知道总体分布,而只需知道抽样分布.

4 2? 三大抽样分布分布、t分布和F分布

2?4.1 分布

4.1.1 简介

第7页(共33页)

抽样分布的研究

若n个相互独立的随机变量?1,?2,的随机变量,其

,?n,均服从标准正态分布(也称独立同分

ni?1布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和??i2构成一新

图1 卡方分布

分布规律称为?2分布(chi-square distribution),其中参数n称为自由度,自由度不同就是另一个?2分布,正如正态分布中均值或方差不同就是另一个正态分布一样

?5?.?2分布的密度函数比较复杂这里就不给出了,同学们也不用去记了.卡方分布

是由正态分布构造而成的一个新的分布,这也正反映了前面所说的正态分布的重要性.对于任意正整数k, 自由度为 k的卡方分布是一个随机变量X的机率分布. 4.1.2 特点

?2分布在一象限内,呈正偏态(右偏态),随着参数n的增大,?2分布趋近于正态分布.?2分布的均值为自由度n,记为D?2?n,这里符号“E”表示对随机变量求均值;?2分布的方差为2倍的自由度2n,记为D?2?2n,这里符号“D”表示对随机变量求方差.从?2分布的均值与方差可以看出,随着自由度n的增大,?2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大).?2分布具有可加性:若有K个服从?2分布且相互独立的随机变量,则它们之和仍是?2分布,新的?2分布的自由度为原来K个?2分布自由度之和.表示为:

?2分布是连续分布,但有些离散分布也服从?2分布,尤其在次数统计上非常广泛.

4.1.3 性质

(1)卡方分布密度曲线下的面积都是1;

第8页(共33页)

抽样分布的研究

(2)卡方值都是正值;

(3)卡方分布是一个正偏态分布;

(4)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜. 4.1.4 概率表

?2分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在?2分布中得对每个分布编制相应的概率值,这通过?2分布表中列出不同的自由度来表示,在?2分布表中还需要如标准正态分布表中给出不同p值一样,列出概率值,只不过这里的概率值是?2值以上?2分布曲线以下的概率.由于?2分布概率表中要列出很多?2分布的概率值,所以?2分布中所给出的p值就不象标准正态分布中那样给出了400个不同的p值,而只给出了有代表性的13个值,因此?2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了.

查?2分布概率表时,按自由度及相应的概率去找到对应的?2值.如上图所示的单侧概率?20.05(7)=14.1?20.05?7??14.1的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.1.

表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值??.例如,要

6在自由度为章 7 的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16,记为?20.05/2?7??16.下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为?21?0.05/2?7??1.69.

当然也可以按自由度及?2值去查对应的概率值,不过这仅往往只能得到一个大概的结果,因为?2分布概率表的精度有限,只给了 13 个不同的概率值进行查表.例如,要在自由度为 18 的?2分布查找?2=30 对应的概率,则先在第一列找到自由度 18,然后看这一行可以发现与 30 接近的有28.9与31.5,它们所在的列是0.05与0.025,所以要查的概率值应于介于0.05与0.025之间,当然这是单侧概率值,它们的双侧概率值界于0.1与0.05之间.如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍.

第9页(共33页)

抽样分布的研究

为什么从正态总体中抽取出的样本的方差服从?2分布

在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的n 个正态随机变量?1,?2,,?n的一次取值,将n个随机变量针对总体均值与方差进行

标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照?2分布的定义,应该服从参数为n的?2分布.

如果将中的总体均值 μ 用样本平均数 ξ 代替,即得,它是否也服从?2分布呢?理论上可以证明,它是服从?2分布的,但是参数不是n而是n?1了,究其原因在于它是n?1个独立同分布于标准正态分布的随机变量的平方和.

我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有n个独立的随机变量,和由它们所构成的k个样本统计量,则这个表达式的自由度为n?k.比如中包含?1,?2,,?n这n个独立的随机变

量,同时还有它们的平均数 ξ 这一统计量,因此自由度为n?1. 4.1.5 定理的导出

定义1

?6? 设X1,X2,...,Xn独立同分布于标准正态分布N?0,1?,则称

2的分布是自由度为n的?2分布,记为?2??2?n?. ?2?X12???Xn?2分布可加性:如果X与Y独立且X????m?,Y??2?n?,则X?Y??2?m?n? 数学期望:E??2?n???n,方差:Var??2?n???2n

定理1 若X1,X2,Xm独立同服从标准正态分布N?0,1?,则称V??Xi2服从自

i?1m?m1?由度为m的?2分布,记为V??2?m?,则V?Ga?,?即V的密度函数为

?22? pV?x??1m?m?22?m?1?1xx2e2

?x?0? (1)

?2???证明:令Y?X12,先求Y的密度函数pY?y?. 因为

第10页(共33页)


抽样分布的研究(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:A320ME飞机放行人员考试

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: