范例:设X服从自由度n1=5,n2=15的F分布,求P(X>2.9)的值.输入公式
=FDIST(2.9,5,15)
得到值为0.05,相当于临界值α.
1.2.9 F分布的反函数
Excel使用FINV函数得到F分布的反函数,即临界值F?(n1,n2),格式为: FINV(上侧概率,自由度1,自由度2)
范例:已知随机变量X服从F(9,9)分布,临界值α=0.05,求其上侧0.05分位点F0.05(9,9).输入公式
=FINV(0.05,9,9)
得到值为3.178897,即F0.05(9,9)= 3.178897. 若求单侧百分位点F0.025(9,9),F0.975(9,9).可使用公式
=FINV(0.025,9,9) =FINV(0.975,9,9)
得到两个临界值4.025992和0.248386.
若求临界值Fα(n1,n2),则使用公式=FINV(α, n1,n2).
1.2.10 卡方分布
Excel使用CHIDIST函数得到卡方分布的上侧概率1?F(x),其格式为:
CHIDIST(数值,自由度)
其中:
数值(x):要判断分布的数值; 自由度(v):指明自由度的数字.
范例:若X服从自由度v=12的卡方分布,求P(X>5.226)的值.输入公式
=CHIDIST(5.226,12) 得到0.95,即1?F(5.226)=0.95或F(5.226)=0.05.
1.2.11 卡方分布的反函数
Excel使用CHIINV函数得到卡方分布的反函数,即临界值??(n).格式为: CHIINV(上侧概率值α,自由度n)
范例:下面的公式计算卡方分布的反函数:
=CHIINV(0.95,12) 得到值为5.226,即?0.95(12)=5.226.
若求临界值χα(n),则使用公式=CHIINV(α, n).
6
2221.2.12 泊松分布
计算泊松分布使用POISSON函数,格式如下:
POISSON(变量,参数,累计)
其中:变量:表示事件发生的次数; 参数:泊松分布的参数值;
累计:若TRUE,为泊松分布函数值;若FALSE,则为泊松分布概率分布值. 范例:设X服从参数为4的泊松分布,计算P{X=6}及P{X≤6}.输入公式
=POISSON(6,4,FALSE) =POISSON(6,4,TRUE) 得到概率0.104196和0.889326.
在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT,开平方函数SQRT,和函数SUM,等等.关于这些函数的具体用法,可以查看Excel的关于函数的说明,不再赘述.
2 区间估计实验
计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.
2.1 单个正态总体均值与方差的区间估计:
?2已知时?的置信区间
2.1.1
置信区间为?x?u????n,x?u?2??2?. n? 例1 随机从一批苗木中抽取16株,测得其高度(单位:m)为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ =0.01(米). 步骤:
(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据. (2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:
=average(b3:g5)-normsinv(1-0.5*?)*?/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(1-0.5*?)*?/sqrt(count(b3:g5)) 上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平?和标准差?是具体的数值而不是符号.本例中,? =0.05, ??0.01,上述两个公式应实际输入为
=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))
7
计算结果为(1.148225, 1.158025).
2.1.2
?2未知时?的置信区间
置信区间为 ?x?t?(n?1)??2SS?,x?t?(n?1)?. nn?2 例2 同例1,但?未知.
输入公式为:
=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) =average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) 计算结果为(1.133695, 1.172555).
2.1.3
?未知时?2的置信区间:
?2?(n?1)s 置信区间为 ?2,???(n?1)?2?(n?1)s??. 2?1??(n?1)?2?2 例3 从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间
(单位:s)如下:
50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5 试求总体方差?的0.9的置信区间(设总体为正态).
操作步骤:
(1)在单元格B3:C7分别输入样本数据;
(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7); (3)在单元格C10中输入置信水平0.1.
(4)计算样本方差:在单元格C11中输入公式=VAR(B3:C7) (5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)
(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12 (7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.
2 8
当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:
=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1) =(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)
2.2 两正态总体均值差与方差比的区间估计
当?12 =??22 =??2但未知时?1-?2的置信区间
??11???.
?n1n2?2.2.1
置信区间为 ??x?y??t?(n1?n2?2)Sw?2 例4 在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为
甲:12.6 13.4 11.9 12.8 13.0?
乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4 蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ1-μ2所在的范围.(取α=0.05) 实验步骤:
(1)在A2:A6输入甲组数据,在B2:B8输入乙组数据;
(2)在单元格B11输入公式=AVERAGE(A2:A6),在单元格B12中输入公式=AVERAGE(B2:B8),分别计算出甲组和乙组样本均值.
(3)分别在单元格C11和C12分别输入公式=VAR(A2:A6),=VAR(B2:B8),计算出两组样本的方差.
(4)在单元格D11和D12分别输入公式=COUNT(A2:A6),=COUNT(B2:B8),计算各样本的容量大小.
(5)将显著性水平0.05输入到单元格E11中. (6)分别在单元格B13和B14输入
=B11-B12-TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)
9
和
=B11-B12+TINV(0.025,10)*SQRT((4*C11+6*C12)/10)*SQRT(1/ 5+1/7)
计算出置信区间的下限和上限.
2.2.2
2?1和??未知时方差比σ1/σ22的置信区间
?21?s, 置信区间为 ?12sF(n?1,n?1)2?2?1?2?s1? .
sF?(n1?1,n2?1)??1?2?2122 例5 有两个化验员A、B,他们独立地对某种聚合物的含氯量用相同的方法各作了10次测定.其测定值的方差分别是SA=0.5419,SB=0.6065.设σ所测量的数据总体(设为正态分布)的方差.求方差比σ操作步骤:
2A2A和σ
2B分别是A、B
/σ
2B的 0.95置信区间.
(1)在单元格B2,B3输入样本数,C2,C3输入样本方差,D2输入置信度. (2)在B4和B5利用公式输入
=C2/(C3*FINV(1-D2/2,B2-1,B3-1))
和
=C2/(C3*FINV(D2/2,B2-1,B3-1))
计算出A组和B组的方差比的置信区间上限和下限.
10