N(0,1)的分布函数?(x), 即 limP{?n?x}=
n??12?x???e?t22dt,则称{?n}服从中心极限定
理。
定理16.9 (林德伯格-列维定理)
设{?n}是独立同分布的随机变量序列,E(?i)??,D(?i)??(有限),若?x?R,
2随机变量?n??(?i?1ni??)n??n?x?收敛于标准正态分布N?0,1?的分的分布函数Fn(x)?P?12?x?t22布函数,即 limFn(x)?limP(?n?x)?n??n?????edt??(x),则{?n}服从中心极限定
理。更进一步的有:对?a?b,limP{a??n?b}??(b)??(a)
n??
n该定理表明当n充分大时, ?n??(?i?1ni??)的分布近似于N(0,1),从而
n???i?1i~N(n?,n?),这意味着许多个相互独立、同分布且存在方差的随机变量之和近似服
2从正态分布.该结论在数理统计的大样本理论中有着广泛的应用,同时也提供了计算独立同分布随机变量之和的近似概率的简便方法. 定理16.10 (棣莫弗-拉普拉斯极限定理)
设?n(n?1,2,?)是n重Bernoulli试验中成功的次数,已知每次试验成功的概率为
p?0?p?1?,q?1?p,则对?x?R,有limP{n???n?npnpq?x}?12??e??x?t22dt???x?;
?
或?a?b,有limP{a?n???n?np?b}???b????a? np??n?npnpq的分布近似于N(0,1)分布,从而?n的分布近似于
由上述定理可以看出,
N(np,npq)分布,由于?n服从于二项分布B(n,p),因而式?称为二项分布收敛于正态分布,
它有助于我们计算出二项分布随机变量?n落入某范围内的概率的近似值.
数理统计的基本概念
§6.1 样本和总体
一、 样本
数理统计的研究对象是受随机性影响的数据,这些通过观察或试验得到的数据称为样本或子样,这些观察或试验过程称为抽样例如用同一架天平称某重物n次,得到一组n个数据 X1,X2,?,Xn
就称它们是一个样本,其中n称为样本容量。每个容量为n的样本都可称为n维空间的一个点,样本所有可能的取值构成了n维空间的一个子集,称为样本空间,记作X. 多次独立的抽样,它们是同分布的,即我们通常称为的随机抽样。如果样本X1,X2,?,Xn满足每个个体被抽到的机会一样,且X1,X2,?,Xn相互独立,则称样本X1,X2,?,Xn为简单随机样本,或就直接称为样本.
样本具有以下二重性:(1)随机性;(2)确定性. 二、 总体
总体或母体在许多教科书上通常被定义为研究对象全体的集合。其含义是,我们观察到的样本总是由某个具体事物产生,并反映该事物的特征,这时,可以把样本视为一些被抽取的该事物的个体,而将该事物本身视为所有个体的集合即总体。
定义:设总体X的分布函数F(x),若X1,X2,?,Xn是具有同一分布函数F(x)的相互独立的随机变量,称X1,X2,?,Xn为总体X中的到的容量为n的简单随机样本,简称样本。把它们的观察值xi,x2,?,xn称为样本值.
§6.3 统计量及其分布
一、 统计量
所谓统计量(Statistic)是一个不含未知参数的样本的已知函数。设样本为
X1,X2,?,Xn,则统计量通常记为
T?T(X1,X2?Xn)
设X1,X2,?,Xn为总体X的样本,则下列各量均是统计量[也叫样本的数字特征],它们今后要经常被用到。
1n1n222(1)X??Xi,X称为样本均值。 (2)S??(Xi?X),S称为样本方差。
ni?1ni?11nk(3)S?S,S称为样本标准差。 (4)Ak??Xi,Ak称为样本k阶原点矩。
ni?121nk(5)Bk??(Xi?X),Bk称为样本k阶中心矩。
ni?1设(X1,Y1),(X2,Y2)?,(Xn,Yn)为二维总体(X,Y)的样本,则下列各量为统计量:
1n(1)S12??(Xi?X)(Yi?Y),S12称为样本协方差.
ni?1S121n2???称为样本相关系数,其中SX??(Xi?X)2,SY类似. ,?(2)?SXSYni?1抽样分布
二、?分布
定义: 设X1,X2,?,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量Y?X1?X2???Xn?2?Xi?1n2i服从自由度为n的?分布,记作Y~
2?2(n).
?2分布有下列基本性质
(1)定理(?分布的可加性定理):设Y1,Y2,?Yk是k个相互独立的随机变量,
2Yj~?(nj),j?1,2?k,则Y??Yj~?(?nj)
2k2kj?1j?1(2)E(X)?n,D(X)?2n.
nx?1??1x2e2,x?0?n2(3)?(n)的密度函数为p(x)??2n,其中?(?)称为伽马函数,定义
2?(2)?,x?0?0?为?(?)???1?xx?edx,??0. 0?2分布的上侧?临界值
对于给定的正数?(0???1),称满足P??2???(n)???2??2??(n)2(n)为p(x)dx??的值???2(n)分布的上侧?临界值。
图5-3描绘了?(n)分布密度函数在n?1,4,10,20时的图形。可以看出,随着n的增大,
2p(x)的图形趋于“平缓”,其图形下面积的重心亦逐步往右下移动。当n?45时可查表得
2(n);当n较大时,2?2(n)?2n?1近似服从N(0,1),?2(n)分布的上侧?临界值??于是??(n)?21(z??2n?1)2,其中z?是标准正态分布N(0,1)的上侧?临界值. 2三、 t分布
2定义: 设X~N(0,1),Y~?(n),X与Y独立,则称随机变量T?XYn服从自由度
为n的t分布,又称学生氏(Student)分布,记成T~t(n).
利用独立随机变量商的密度公式,不难由已知的N(0,1),?(n)的密度公式得到t(n)的密
2n?1n?1)2?x2度:g(x)?(1?)2,???x???
nnn??()2?(显然它是x的偶函数,图5-4描绘了n?2,5时t(n)的概率密度曲线,作为比较,还描绘了
N(0,1)的密度曲线。
利用伽马函数的斯特林(Stirling)公式可以证明g(x)?
1?x2e,n??,从图形我们也2?2可看出,随着n的增大,t(n)的密度曲线与N(0,1)的密度曲线越来越接近,一般若n?30,就可认为它基本与N(0,1)相差无几了。
t分布的性质
(1)概率密度函数g(x)关于t?0对称;(2)概率密度函数g(x)在t?0达到最大值. (3)概率密度函数g(x)的图形以t轴为水平渐近线.
(4)概率密度函数g(x)?越接近.
t分布的上侧?临界值
1e2??x22,n??,t(n)的密度曲线与N(0,1)的密度曲线越来
对于给定的正数?(0???1),称满足Pt?t?(n)??????t?(n)g(x)dx??的值t?(n)为t(n)分布的上侧?临界值。当n?45时,t?(n)可查表得到;当n?45时,t?(n)?z?,其中z?是标准正态分布N(0,1)的上侧?临界值,由分布的对称性得知t1??(n)??t?(n).
四.F分布
定义: 设X~?(m),Y~?(n),X与Y独立,则称随机变量F?22Xm服从自由度Yn为(m,n)的F分布,记成F~F(m,n).其中m为第一自由度,n为第二自由度.