2设?~N?,?,(?1,?2,?,?n)是?的样本,则
??? ??2?,~N??n??? 或 U??????N?0,1?
?/n~
2.常用统计分布 (1)?2分布
定义1 设X1,X2,?,Xn是取自总体N(0,1)的样本, 则称统计量
22?2?X12?X2???Xn (1)
服从自由度为n的?2分布,记为?2~?2(n).
这里, 自由度是指(1)式右端所包含的独立变量的个数.
2(n),对给定的实数?(0???1), 称满足条件 定义2设?2~????2P{?2???(n)}???f(x)dx?? 2(n)?2的点??(n)为?2(n)分布的水平?的上侧分位数. 简称为上侧?分位数.
(2)t分布
定义3 设X~N(0,1),Y~?2(n),且X与Y相互独立,则称
Y/n服从自由度为n的t分布, 记为t~t(n).
t?X
定义4设T~t?(n),对给定的实数?(0???1), 称满足条件
P{T?t?(n)}??t??f(x)dx?? ?(n)的点t?(n)为t(n)分布的水平?的上侧分位数. 由密度函数f(x)的对称性,
可得 t1??(n)??t?(n).
(3)F分布
定义5 设X~?2(m),Y~?2(n),且X与Y相互独立, 则称
X/mnX F??Y/nmY服从自由度为(m,n)的F分布, 记为F~F(m,n).
定义6设F~F?(n,m),对给定的实数?(0???1),称满足条件
??P{F?F?(n,m)}??Ff(x)dx?? ?(n,m)的点F?(n,m)为F(n,m)分布的水平?的上侧分位数.
F分布的一个重要性质:
F?(m,n)?1.
F1??(n,m)此式常常用来求F分布表中没有列出的某些上侧分位数.
共 36 页 第 21 页
3. 抽样分布
单正态总体的抽样分布
设总体X的均值?,方差为?2,X1,X2,?,Xn是取自X的一个样本,X与S2分别为该样本的样本均值与样本方差, 则有
E(X)??,D(X)??2,
?1?n22??X?nX而 E(S)?E????? i???n?1?i?11?n1?n222?222?2?E(X)?nE(X)?(???)?n(?/n??)??.??i????n?1?i?1?n?1?i?1?2故有下列定理:
定理1 设总体X~N(?,?2), X1,X2,?,Xn是取自X的一个样本, X与S2分别为该样本的样本均值与样本方差, 则有
(1) X~N(?,?2/n);
X??~N(0,1). (2) U??/n定理2 设总体X~N(?,?2), X1,X2,?,Xn是取自X的一个样本, X与S2分别为该样本的样本均值与样本方差, 则有 (1) ?=
2n?1?2?2i?1 (2) X与S2相互独立.
定理3 设总体X~N(?,?2),X1,X2,?,Xn是取自X的一个 样本, X与S2分别为该样本的样本均值与样本方差, 则有
1n2(1) ??2?(Xi??)2~?2(n)
?i?1X??T?~t(n?1). (2)
S/nS?2122?(Xi?X)~?(n?1);
n
二、参数估计
参数估计就是用样本的统计量??估计总体参数?,我们称它为估计量,其具体值称为估计值。参数估计通常分为点估计和区间估计两种
1. 评价估计量的优良性准则
因为样本的统计量是随机变量,所以估计量也是是随机变量。对于不同的样本它会得到不同的估计量,那么怎样评判哪一个估计量更好呢?标准通常采用以下三个准则:
???,?,?,??的数学期望等于未知参数的真值⑴ 无偏性 若估计量?12n?,即E(??)??,则称??是?的无偏估计。
共 36 页 第 22 页
⑵ 有效性 若??1与??2都是?的无偏估计量,而??1的方差小于??2的方差,即D(??1)?D(??2),则称??1较??2是?的有效估计量。
2. 点估计
从总体中抽取一个样本,用这组样本观测值来估计总体参数的值,这种估计方法称为参数的点估计(也称定值估计)。
用点估计法来估计总体的参数方法简单,但由于样本的随机性,估计值会因样本的不同而不同,甚至会有很大的差异。
(1)矩估计法
用相应的样本矩去估计总体矩的方法就称为矩估计法. 用矩估计法确定的估计量称为矩估计量. 相应的估计值称为据估计值. 矩估计量与矩估计值统称为矩估计. 求矩估计的方法:
设总体X的分布函数F(x;?1,?,?k)中含有k个未知参数?1,?,?k, 则 (1) 求总体X的前k阶矩?1,?,?k,一般都是这k个未知参数的函数, 记为
?i?gi(?1,?,?k),i?1,2,?,k (*)
(2) 从(*)中解得 ?j?hj(?1,?,?k),j?1,2,?,k (3) 再用?i(i?1,2,?,k)的估计量Ai分别代替上式中的?i,即可得?j(i?1,2,?,k)的矩估计量:
??h(A,?,A),j?1,2,?,k. ?jj1k(2)极大似然估计法
????(x,x,?,x), 定义 若对任意给定的样本值x1,x2,?,xn, 存在?12n????(x,x,?,x)为?的极大似然估计值.称相应?)?maxL(?),则称?使 L(?12n??(X,X,?,X)为?极大似然估计量. 它们统称为?的极大似然的统计量?12n估计(MLE).
求最大似然估计的一般方法
求未知参数?的最大似然估计问题, 归结为求似然函数L(?)的最大值点的问题. 当似然函数关于未知参数可微时, 可利用微分学中求最大值的方法求之. 其主要步骤:
(1) 写出似然函数L(?)?L(x1,x2,?,xn,?);
dL(?)dlnL(?)(2) 令?0或?0, 求出驻点;
d?d?注: 因函数lnL是L的单调增加函数,且函数lnL(?)与函数L(?)有相同的极值点,故常转化为求函数lnL(?)的最大值点较方便.
(3) 判断并求出最大值点, 在最大值点的表达式中, 用样本值代入就
共 36 页 第 23 页
得参数的最大似然估计值.
注:(i) 当似然函数关于未知参数不可微时,只能按最大似然估计法的基本思想求出最大值点。
(ii) 上述方法易推广至多个未知参数的情形. 例题选讲:
例1设总体X的概率密度为
?(??1)x?,0?x?1 f(x)??矩估计.
解 数学期望是一阶原点矩
11??1?1?E(X)??0(??1)x?dx?(??1)?0xdx?其它?0,其中?(???1),是未知参数,X1,X2,?,Xn是取自X的样本, 求参数?的
??1, ??2其样本矩为X?x?0?0,其中??0, 是未知参数. x1,x2,?,xn是来自总体X的样本观察值, 求参数?的最大似然估计值.
n????xi?n解 似然函数L(x1,x2,?,xn;?)???ei?1,xi?0
?0,其它?2X?1??1??, 即为?的矩估计. , 而?1?X??2例2设总体X服从指数分布, 其概率密度函数
??e??x,x?0 f(x,?)??显然L(x1,x2,?xn;?)的最大值点一定是L1(x1,x2,?,xn;?)??ne最大值点, 对其取对数lnL1(x1,x2,?,xn;?)?nln????xi
i?1n???xii?1n的
dlnL1(x1,x2,?,xn;?)nn由???xi?0, 可得参数?的最大似然估计值
d??i?1??n?1. ?nx?xii?1
3. 区间估计
设?是总体?分布中的未知参数,?1,?2,?,?n是取自总体?的样本,构造两个统计量?1??1,?2,?,?n?和?2??1,?2,?,?n?,使得包含未知参数?区间(?1,?2)的概率为1??,即
共 36 页 第 24 页
(5-41) 这样的估计方法称为区间估计。区间(?1,?2)叫置信区间,?1及?2分别叫置信区间的上下限,如图5-22所示。1??叫置信系数,也叫置信概率或置信度,而?是事先给定的一个小正数,它是指参数估计不准确的概率,通常取值0.01,0.05,0.10等。(5-9)式的意义是反复抽样多次(每次样本容量都相等),每组样本观测值确定一个区间(?1,?2),在这样多的区间中,包含?真值的约占1??,不包含真值的仅占?左右。
??x?P??1????2??1?? 1??0?1??2x图5-22
区间估计较点估计的优点:既反映了估计结果的精确度又表明了这个估计结果的可靠程度。
正态总体均值区间估计
2
1? 已知方差?,求均值?的置信区间。
设总体?~N?,?2,?1,?2,?,?n为?的一个随机样本,可选用U变量
???~N?0,1? U????n
求参数?的置信区间。
由正态分布表可知,对给定的??0???1?,存在一个临界值?,使
P?U????1??
即
?????????????1?? 或 P????nn?这时参数?的1??置信区间为
?????,???? ????nn?(5-42) 例如??0.05时, 查正态分布表可得
P?U????0.95
??1.96
于是有
共 36 页 第 25 页