考研概率与数理统计(6)

2019-03-15 12:32

N(0,1)的分布函数?(x), 即 limP{?n?x}=

n??12?x???e?t22dt，则称{?n}服从中心极限定

理。

定理16.9 (林德伯格-列维定理)

设{?n}是独立同分布的随机变量序列，E(?i)??,D(?i)??（有限），若?x?R，

2随机变量?n??(?i?1ni??)n??n?x?收敛于标准正态分布N?0,1?的分的分布函数Fn(x)?P?12?x?t22布函数，即 limFn(x)?limP(?n?x)?n??n?????edt??(x)，则{?n}服从中心极限定

理。更进一步的有：对?a?b，limP{a??n?b}??(b)??(a)

n??

n该定理表明当n充分大时, ?n??(?i?1ni??)的分布近似于N(0,1),从而

n???i?1i~N(n?,n?),这意味着许多个相互独立、同分布且存在方差的随机变量之和近似服

2从正态分布.该结论在数理统计的大样本理论中有着广泛的应用,同时也提供了计算独立同分布随机变量之和的近似概率的简便方法. 定理16.10 (棣莫弗-拉普拉斯极限定理)

设?n(n?1,2,?)是n重Bernoulli试验中成功的次数，已知每次试验成功的概率为

p?0?p?1?,q?1?p，则对?x?R,有limP{n???n?npnpq?x}?12??e??x?t22dt???x?；

或?a?b，有limP{a?n???n?np?b}???b????a? np??n?npnpq的分布近似于N(0,1)分布,从而?n的分布近似于

由上述定理可以看出,

N(np,npq)分布,由于?n服从于二项分布B(n,p),因而式?称为二项分布收敛于正态分布,

它有助于我们计算出二项分布随机变量?n落入某范围内的概率的近似值.

数理统计的基本概念

§6.1 样本和总体

一、样本

数理统计的研究对象是受随机性影响的数据，这些通过观察或试验得到的数据称为样本或子样，这些观察或试验过程称为抽样例如用同一架天平称某重物n次，得到一组n个数据 X1,X2,?,Xn

就称它们是一个样本，其中n称为样本容量。每个容量为n的样本都可称为n维空间的一个点，样本所有可能的取值构成了n维空间的一个子集，称为样本空间，记作X．多次独立的抽样，它们是同分布的，即我们通常称为的随机抽样。如果样本X1,X2,?,Xn满足每个个体被抽到的机会一样，且X1,X2,?,Xn相互独立，则称样本X1,X2,?,Xn为简单随机样本，或就直接称为样本.

样本具有以下二重性：（1）随机性；（2）确定性. 二、总体

总体或母体在许多教科书上通常被定义为研究对象全体的集合。其含义是，我们观察到的样本总是由某个具体事物产生，并反映该事物的特征，这时，可以把样本视为一些被抽取的该事物的个体，而将该事物本身视为所有个体的集合即总体。

定义：设总体X的分布函数F(x)，若X1,X2,?,Xn是具有同一分布函数F(x)的相互独立的随机变量，称X1,X2,?,Xn为总体X中的到的容量为n的简单随机样本，简称样本。把它们的观察值xi,x2,?,xn称为样本值.

§6.3 统计量及其分布

一、统计量

所谓统计量(Statistic)是一个不含未知参数的样本的已知函数。设样本为

X1,X2,?,Xn，则统计量通常记为

T?T(X1,X2?Xn)

设X1,X2,?,Xn为总体X的样本，则下列各量均是统计量[也叫样本的数字特征]，它们今后要经常被用到。

1n1n222（1）X??Xi,X称为样本均值。（2）S??(Xi?X),S称为样本方差。

ni?1ni?11nk（3）S?S,S称为样本标准差。（4）Ak??Xi,Ak称为样本k阶原点矩。

ni?121nk（5）Bk??(Xi?X),Bk称为样本k阶中心矩。

ni?1设(X1,Y1),(X2,Y2)?,(Xn,Yn)为二维总体(X,Y)的样本，则下列各量为统计量：

1n(1)S12??(Xi?X)(Yi?Y),S12称为样本协方差.

ni?1S121n2???称为样本相关系数，其中SX??(Xi?X)2，SY类似. ,?(2)?SXSYni?1抽样分布

二、?分布

定义：设X1,X2,?,Xn为相互独立的随机变量，它们都服从标准正态N(0,1)分布，则称随机变量Y?X1?X2???Xn?2?Xi?1n2i服从自由度为n的?分布，记作Y～

2?2(n)．

?2分布有下列基本性质

（1）定理（?分布的可加性定理）：设Y1,Y2,?Yk是k个相互独立的随机变量，

2Yj~?(nj),j?1,2?k，则Y??Yj~?(?nj)

2k2kj?1j?1（2）E(X)?n，D(X)?2n.

nx?1??1x2e2,x?0?n2（3）?(n)的密度函数为p(x)??2n，其中?(?)称为伽马函数，定义

2?(2)?,x?0?0?为?(?)???1?xx?edx,??0. 0?2分布的上侧?临界值

对于给定的正数?（0???1），称满足P??2???(n)???2??2??(n)2(n)为p(x)dx??的值???2(n)分布的上侧?临界值。

图5-3描绘了?(n)分布密度函数在n?1,4,10,20时的图形。可以看出，随着n的增大，

2p(x)的图形趋于“平缓”，其图形下面积的重心亦逐步往右下移动。当n?45时可查表得

2(n)；当n较大时，2?2(n)?2n?1近似服从N(0,1)，?2(n)分布的上侧?临界值??于是??(n)?21(z??2n?1)2，其中z?是标准正态分布N(0,1)的上侧?临界值. 2三、 t分布

2定义：设X~N(0,1)，Y~?(n)，X与Y独立，则称随机变量T?XYn服从自由度

为n的t分布，又称学生氏(Student)分布,记成T~t(n)．

利用独立随机变量商的密度公式，不难由已知的N(0,1)，?(n)的密度公式得到t(n)的密

2n?1n?1)2?x2度：g(x)?(1?)2,???x???

nnn??()2?(显然它是x的偶函数，图5-4描绘了n?2,5时t(n)的概率密度曲线，作为比较,还描绘了

N(0,1)的密度曲线。

利用伽马函数的斯特林(Stirling)公式可以证明g(x)?

1?x2e,n??，从图形我们也2?2可看出,随着n的增大,t(n)的密度曲线与N(0,1)的密度曲线越来越接近，一般若n?30,就可认为它基本与N(0,1)相差无几了。

t分布的性质

（1）概率密度函数g(x)关于t?0对称；（2）概率密度函数g(x)在t?0达到最大值. （3）概率密度函数g(x)的图形以t轴为水平渐近线.

（4）概率密度函数g(x)?越接近.

t分布的上侧?临界值

1e2??x22,n??,t(n)的密度曲线与N(0,1)的密度曲线越来

对于给定的正数?（0???1），称满足Pt?t?(n)??????t?(n)g(x)dx??的值t?(n)为t(n)分布的上侧?临界值。当n?45时，t?(n)可查表得到；当n?45时，t?(n)?z?，其中z?是标准正态分布N(0,1)的上侧?临界值，由分布的对称性得知t1??(n)??t?(n).

四.F分布

定义：设X~?(m)，Y~?(n)，X与Y独立，则称随机变量F?22Xm服从自由度Yn为（m,n）的F分布，记成F~F(m,n)．其中m为第一自由度，n为第二自由度.

共8页:

考研概率与数理统计(6).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档