3.4 母体分布的假设检验
分布的假设检验:对母体的分布作某项假设,再从母体上抽取子样,用以检验该假设应予接受还是拒绝。
检验母体的分布为某个完全已知的分布,?分类??检验母体的分布为某已知类型,但有k个未知参数
检验方法有多种,这里只介绍常用的?检验法。
(1)假设母体的分布已知,且是只有有限多项的离散分布 ①在母体上作假设 H0:P(Ai)?pi,i其中A1,2?1,2,?,l.
A2,?,Al是一个完备事件组,pi是已知数。
②从母体抽取容量为n?50的大子样,得
Ai发生的频数为mi,i?1,2,?,l,其中
?m?n.
ii?1l③计算理论频数:由于P(Ai)?pi,则在n次独立重复试验中,Ai发生的次数Yi~B(n,pi),从而理论频数E(Yi)?npi,i事件?1,2,?,l,即有
Ai A1 A2 实际频数理论频数mi m1 m2 npi np1 np2
? Al ? ml ? npl ④检验统计量:构造mi对npi的偏差的加权平方和
1??? (mi?npi)2 (3.5.1)
i?1npi2l2?~?(l?1),于是取大子样时,检验统计量 由K.Pearson定理知:(3.5.1)式中的
H02n???~?2(l?1)
H02近似⑤拒绝域:由?的意义知,在?的值较小时应接受H0,故给定显著水平?,构造小概率事件
2P{?2???(l?1)}??
22取拒绝域为
2W?{(x1,x2,?,xn)?2???(l?1)}
⑥决策:当抽样结果是(x1,x2,?,xn)?W时,拒绝H0,认为母体分布与H0中的分布有显著差异;否则接受H0,认为无显著差异. (2)检验母体
X的分布形式已知的假设
:F(x)?F0(x;?1,?2,?,?k),其中?1,?2,?,?k为k个未知参数。
???①在母体上作假设H0②从母体抽取容量为n?50的大子样,求出?1,?2,?,?k的最大似然估计值?1,?2,?,?k,则F(x)?F0(x;?1,?2,?,?k)成为已知函数.
③分组求理论频数,构造大子样列表
选分点a0?a1?a2???al,(可以是a0???,al???),将子样分为l组:
???Ai?{Xi?(ai?1,ai]},i?1,2,?,l. 则:
pi?P(Ai)?P(ai?1?Xi?ai)?F(ai)?F(ai?1)?F(ai;?1,?2,?,?k)?F(ai?1;?1,?2,?,?k), i?1,2,?,l于是有下表:
分组 理论频率理论频数实际频数?????? Al A1 A2 ?pi p1 p2 ? pl npi np1 np2 ? npl mi m1 m2 ? ml ???2i?1l④检验统计量:构造mi对npi的偏差的加权平方和
1(mi?npi)2 (3.5.2) npi定理:(3.5.2)式中的?2n??H0~?2(l?k?1).
(注:l是子样组数,k是未知参数的个数,当k于是取大子样时,检验统计量
近似H0?0时此定理即K.Pearson定理)
?~?2(l?k?1)
2⑤
22W?{(x,x,?,x)???拒绝域为 12n?(l?k?1)}
⑥决策:当抽样结果是(x1,x2,?,xn)?W时,拒绝H0,认为母体分布函数与F0(x)有显著差异;否则接受H0,认为无显著差异.
注①要用大子样,n?50; ②要求理论频数npi?5,i③取组数l?1,2,?,l,否则进行组的合并;
?7~14,但为了保证npi?5,可使l2?7;
④需要并组时,?
(l?k?1)中的l是并组后的组数。
第四章 方差分析、正交试验设计
§4.1 一元方差分析
问题:已知某个指标的取值可能与因子种水平下的试验指标
A有关,A有r种水平A1,A2,?,Ar,每一
X1,X2,?,Xr看作相互独立且方差相等的正态母体,即
ri?1,共?ni?n次,获得试验值Xi~N(?i,?2),现在水平i下作了ni次试验(i?1,2,?,r)
Xij,i?1,2,?,r,j?1,2,?,ni,即有
水 平 试 验 值 A1A2 ?Ar
X11,X12,?,X1n1 X21,X22,?,X2n2 ? Xr1,Xr2,?,Xrnr 试分析因子A对试验指标有无显著影响?
(1)在母体上作假设
H0:?1??2????r?H1:?i不全相等;
(2)寻找检验统计量
①由于Xi1,Xi2,?,Xini~N(?i,?2),(i?1,2,?,r),定义如下量:
1?21rni1r??E(X)?~N(?,)总均值:X???Xij??niXi,
nnni?1j?1ni?11水平Ai的均值:Xi?nir?n?ii?1ri;
?Xj?1niniij~N(?i,?2ni);
离差平方总和:QT???(Xij?X)2;
i?1j?1组内离差平方和:QE?指标取值的差异程度;
??(Xi?1j?1rnirniij?Xi),其中?(Xij?Xi)2反映了水平Ai的内部
2j?1ni组间离差平方和: QA?ni??(Xi?1j?1i?X)??ni(Xi?X)2
2i?1r?(Xi?X)2j?1rni?ni(Xi?X)2反映了各个水平之间指标取值的差异程度.
②平方和分解
QT???(Xij?X)2
i?1j?1???[(Xij?Xi)?(Xi?X)]2i?1j?1rnirni???(Xij?Xi)2???(Xi?X)2?2??(Xij?Xi)(Xi?X)i?1j?1i?1j?1i?1j?1rnirni
???(Xij?Xi)??ni(Xi?X)?2??(Xij?Xi)(Xi?X)
22i?1j?1nirnirrnii?1i?1j?1其中:2??(Xij?Xi)(Xi?X)?i?1j?1r2?[(Xi?X)?(Xij?Xi)]
i?1j?1rrni?2?[(Xi?X)(?Xij?niXi)]?2?[(Xi?X)(niXi?niXi)]?0
i?1j?1rnii?1从而
QT???(Xij?Xi)??ni(Xi?X)2
2i?1j?1i?1rnir注意到上式右端第一项、第二项分别为QE、QA,即有 QT?QE?QA
于是,总离差平方和被分解为组内离差平方和与组间离差平方和之和。
③分解定理
定理4.1.1:设Y1,Y2,?,Yn相互独立,Yi~N(0,1),i?1,2,?,n,于是
Q?Y1?Y2???Yn~?2(n),又若Q?Q1?Q2222???Qr,其中Qi是Y1,Y2,?,Yn的线
性组合的平方和(即非负定二次型),自由度为fj,j?1,2,?,r,则有
Q1,Q2,?,Qr相互独立,且Qj~?2(fj)?n?f1?f2???fr.
222关于二次型的自由度:如果二次型Q?y1中的y1,y2,?,yn满足s个独立?y2???yn的线性关系(约束条件),则称二次型Q的自由度为n-s.
当H0成立时,
?1??2????r??,Xi~N(?,?2),
i?1,2,?,r,而
Xi1,Xi2,?,Xini是Xi的子样,故Xij~N(?,?2),Xij???~N(0,1),i?1,2,?,r,
j?1,2,?,ni相互独立,于是
Q???(i?1j?1rniXij???)2~?2(n)
且有
Q? ? ? ?1??2??[(Xi?1j?1rnirniij?X)?(X??)]2?X)??0212??(Xi?1j?11ij?2??(X??)i?1j?1rni2?2?2??(Xi?1j?1rniij?X)(X??)
QT?2QE??n(X??)2?2QA?2?2r?(X??2)?/n上式中
niQE?2???(i?1j?1niXij?Xi?ni)2是n项平方和,有r个独立的约束条件
QE?(j?1Xij?Xi?)?0,即
1?[?Xij?niXi]?0,i?1,2,?,r,故二次型Q1?j?1?2的自
由度为
f1?n?r;
2QA???ni(i?1rXi?X?)是r项平方和,有1个约束条件
2?ni?1rXi?Xi??0,即