一次试验中小概率事件是难以发生的,倘若小概率事件在一次试验中发生了,就有理由怀疑“X≥c”不是一个小概率事件。这一矛盾导致我们不相信原假设H0为真,从而否定原假设H0。所以得到检验准则:
当X≥8350.9时,拒绝H0, 当X<8350.9时,保留H0。
结论:8300不足以证明新菜单对每天的营业额有影响,其概率保证程度为95%。
以下引申问题提出以后,请先根据“直觉”判断答案,不能确定答案时可以考虑变动的方向:更有可能还是更不可能。
引申问题1:如果改变概率保证程度,使我们相信新菜单对每天的营业额有影响,要改变到多少?即求φ分布表可知,概率为92.02%。
引申问题2:如果这老板非常小心,概率不到99%,他不能相信新菜单对每天的营业额有影响,那这时需要9天的营业额均值达到多少?概率为99%,φ=2.3263,则c=8000+2.3263*(640/3)=8 496. 3。
引申问题3:如果找到16天的营业额资料,均值为8300,是否相信新菜单对每天的营业额有影响(概率保证程度为95%)?1-φ
????c?8000??=0.05。临界值?640???4???????8300?8000?= 1.40625,由正态
640????3??c=8000+1.645*(640/4)=8 263.2。说明新菜单对每
天的营业额有影响。
引申问题4:如果改变方差为2562,在95%的概率保证程度下,8300的平均营业额是否说明新菜单对每天的营业额有影响?即求“1-
φ
?????c?8000??256???3??=0.05”中的c。
?????c?8000??256???3??=1.645,则临界值
c=8000+1.645*(256/3)= 8140.37,说明新菜单对每天的营业额有影响。
引申问题5:如果改变方差为2562,8300的平均营业额说明新菜
????8300?8000??单对每天的营业额有影响的概率是多少??256?= 3.515625 ??3??,由正
态分布表可知,概率为99.9781%
假设检验的两类错误:弃真(α类错误、Ⅰ型错误)与纳伪(β类错误、Ⅱ型错误)。好的检验规则应该保证二两类错误都比较小。α过低,排斥性太高,导致β上升。
处理两类错误的原则:第一,优先考虑弃真错误。因为原假设通常可以给出明确的陈述,而备择假设则比较模糊。所以,弃真错误的概率不应定得太大,否则即使接受了备择假设,对总体得了解叶不会有太多的帮助。第二,在弃真错误发生概率确定之后,使纳伪错误发生的概率达到最小。
假设检验也称显著性水平检验,按照两类错误原则建立起来的假
设检验也称最大功效检验。
二、总体均值检验 1.单样本总体均值检验
(1)总体为正态总体且已知方差。 检验统计量为: X???n~N(0,1)
1-α/2的值,
对于给定的显著性水平α,查正态分布概率表,得到μ检验的拒绝域为:
??X??0???c=???1?2??n????? ???【例17】某种零件尺寸服从正态分布N(μ,1.21),抽6件,各为: 32.56、29.66、31.64、30.0、31.87、31.03 在α=0.05的情况下,能否认为均值为32.50? 解:样本均值X=31.13,方差1.21,α=0.05
提出假设:
H0: μ=32.50 H1: μ≠32.50 检验统计量为:
X???n~N(0,1)
32.50计算检验统计量:31.131?=-3.051 .16由α=0.05,查正态分布概率表,得到μ
1-α/2=1.96
|-3.051|>1.96,拒绝H0。(不认为这批零件尺寸服从正态分布N(32.50,1.21))。
(2)总体为正态总体,但未知方差。
需要使用t检验。(t分布与正态分布的形状相似,但略平坦。)检验统计量为:
X??S~t(n-1) n双侧检验的拒绝域:
?????X????t?(n?1)??S1?2?c=? ??n??右单侧检验的拒绝域:
?????X????t1??(n?1)??S?c=?
??n??
左单侧检验的拒绝域:
????X?????t(n?1)c=?1???S? ????n??【例18】工业废水排放标准为0.5,一家企业的5个水样,组成样本。0.53、0.542、0.510、0.495、0.515。问,它的排放符合标准吗?(α=0.05) 解:μ=0.5,α=0.05
样本均值为0.5184,方差为0.01817 提出假设:
H0:μ=0.5 H1:μ>0.5 建立检验统计量:
X??Sn~t(n-1)
计算统计量的值:
0.5184?0.5=2.264 0.018175对于α=0.05,t0.95(4)=2.1318,2.264>2.1318,故可以认为该企业的排放不符合标准,即超标。
EXCEL中求t值:
t分布函数的语法:TDIST(随机变量t值,自由度,单区间或双区间)=概率值
其逆函数:TINV(双侧概率值,自由度)= t值(注意:系统默认值是双侧区间,此题中,输入时要输入2倍的概率值)
如TDIST(2.1318,4,1)=0.050003 TINV(0.1,4)=2.131846 2.两样本的总体均值差检验
(1)两总体皆为正态总体且已知方差。