正态分布 t分布(ν=4)
标准化正态分布与自由度为4的t分布曲线
和正态概率累积函数一样,t分布的概率累积函数也分一尾和两尾表。一尾表为t到∞的面积,两尾表为﹣∞到-t 和t到∞两个相等尾部的和。附表4(P360)是两尾表。 按t 分布进行的假设测验称t 测验。在t表中,若ν相同,则P 越大,t 越小;P 越小,t 越大。
4.2.2 单个样本平均数的假设测验
这是测验某一样本所属的总体平均数是否和某一指定的总体平均数相同。
[例5.1]某春小麦良种的千粒重μ0 =34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异? 测验步骤为:
H0:新引入品种千粒重与当地良种千粒重指定值相同,即μ =μ0 =34g;对HA: μ ≠34g 显著水平α=0.05
_测验计算: (35.6+37.6+…+34.6)/8=35.2(g) y = _2(y)2281.72??2222?35.6?37.6?...?34.6??18.83?y?y??y? SS?n8??_
s1.64y??35.2?34s_???0.58(g)t???2.069 s?SS?18.831.64(g)ys_0.58n8n?18?1 y查附表4,ν=7时,t 0.05=2.365。现实得|t|<tα=2.365,故P>0.05。
推断:接受H0: μ=34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。 4.2.3 两个样本平均数的假设测验
这是由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。测验的方法因试验设计的不同而分为成组数据的平均数比较和成对数据的比较两种。 一、成组数据的平均数比较
如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,
__所得数据皆称为成组数据,以组平均数作为相互比较的标准。 22(y1?y2)?(?1??2)??12u?1、 在两个样本的总体方差已知时,用u 测验。 ?__???__y1?y2nn2 1y1?y22
[例5.2] 据以往资料,已知某小麦品种每平方米产量的σ_=0.4(kg)2。今在该品种的一块地上用A、_y2 B两法取样,A法取了12个样点,得每平方米 y 1 =1.2(kg);B法取得8个样点,得
=1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?
???假设H0:A、B两法的产量相同,即H0:系随机误差;
对HA:μ1≠μ2,α=0.05
测验计算: ?2??2??2?0.4,n?12,n?8,?__?0.4?0.4?0.2887(kg)1212y1?y21281.2?1.4
u???0.69 0.2887因为实得|u|<u0.05=1.96,故P>0.05。
推断:接受H0: μ1=μ2,即A、B两种取样方法所得每平方米产量没有显著差异。
的加权平均值,即: (y1?y1)?(y2?y2)s__?SS1?SS22s??y1?y2e ?1??2(n1?1)?(n2?1)当n1=n2=n 时,则上式变为:
__ 2se2__(y1?y2)?(?1??2)s?__ y ? y t ? ( y 1? y2)n12t?s__由于假设H0: μ1=μ2,故上式为:s__y1?y2
y1?y2[例5.4]研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:
?_2?_2
22sese?n1n2
从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设H0:喷施矮壮素的株高与未喷的相同或更高,,即H0: μ1≥μ2对HA: μ1<μ2,即喷施矮壮素的株高较未喷的为矮。显著水平α=0.05。 __测验计算: y1?176.3cm,y2?233.3cmSS1?3787.5SS2?18400 218400?3787.5?1479.17176.3?233.3 se?7?8t???3.05 18.68811 s1479.17(?)?18.688(cm)__?y?y89 12按ν=7+8=15,查t 表得一尾t0.05=1.753(一尾测验t0.05等于两尾测验的t0.10),现实得t=-3.05<- t0.05=-1.753,故P<0.05。
推断:否定H0: μ1≥μ2,接受HA: μ1<μ2,即认为玉米喷施矮壮素后,其株高显著地矮于对照。
二、成对数据的比较
若试验设计是将性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。
成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。
设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为
d它具有ν=n-1。若假设H0:μd=0,则上式改成: t?s_即可测验H0:μd=0。
[例5.6] 选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另
_
s_?d?(d?d)n(n?1)_2t?d??ds_d_d一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为
病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。 假设:两种处理对纯化病毒无不同效果,即: H0:μd=0 _;对HA:μd≠0。显著水平α=0.01。
d ?测验计算: ?(?15)?1?...?(?12)?/7??58/7??8.3 SSd?(?15)2?12?...?(?12)2?(?58)2/7?167.43 167.43?8.3s?1.997t???4.16_? d7?61.997查附表4, ν=7-1=6时,t0.01=3.707。实得|t|> t0.01,故P<0.01。
推断:否定H0:μd=0,接受HA:μd≠0,即A、B两法对纯化病毒的效应有极显著差异。 4.3 二项资料的百分数假设测验
许多生物学试验的结果是用百分数或成数表示的,如结实率、发芽率、杀虫率等等。在理论上,这类百分数的假设测验就应按二项分布进行,即从二项式(p+q)n的展开式求出某项属性个体百分数 的概率。但是,如果样本容量n 较大,p不过小,而np 和nq 均不小于5时,(p+q)n的分布趋于正态分布。因而可以将百分数资料作正态分布处理,从而作出近似的测验,以简化测验工作。
4.3.1 单个样本百分数的假设测验 这是测验某一样本百分数 ? 所属总体的百分数与某一理论值或期望值p0的差异显著性
p??p0p p0(1?p0)u??? ?p?p?n即可测验H0:p=p0。
[例5.8]以紫花和白花的大豆品种杂交,在F2代共得289株,其中紫花208株,白花81株。如果花色受一对基因控制,根据遗传学原理,F2代紫花株与白花株的分离比例应为3:1,即紫花理论百分数p=0.75,白花理论百分数q=0.25。问该试验结果是否符合一对基因的遗传规律?
假设大豆花色遗传符合一对基因的遗传规律,紫花植株的百分数是75%,即H0:p=0.75;对HA:p≠0.75。显著水平α=0.05 。 测验计算: 2080.75?0.250.7197?0.75?p??0.7197,???0.0255?pu???1.19 2892890.0255因为实得|u|<u0.05,故P>0.05。 推断:接受H0。
4.3.2 两个样本百分数相比较的假设测验
一、两个总体该种属性的百分数已知为p1和p2 则两样本的差数标准误为:
p1q1p2q2 ?p??1?p?2?n1n2
二、在两总体的百分数p1和p2未知时,则在两总体方差
11y1?y2 ??pq(?)?1?p?2pp?q?1?pnn 12n1?n2?1?p?2pu?故由
?p?1?p?2
即可对H0:p1=p2作出假设测验。 作为p1和p2的估计。
? 1 );调[例5.9]调查低洼地小麦378株(n1),其中有锈病株355株(y1),锈病率为93.92%( p? 2 )。试测验两块麦田的锈查高坡地小麦396株(n2),其中锈病346株(y2),锈病率87.31%( p
病率有无显著差异?
假设H0:p1=p2,对HA:p1≠p2。显著水平α=0.05 。
355?346测验计算: p?1?0.9061,q?1?p?1?0.906?0.094 ?2378?396(?)?0.0210?1?p?2?0.906?0.094p378396
0.9394?0.8731
u??3.16 0.0210实得|u|>u0.05,故P<0.05。
推断:接受HA:p1≠p2,即两块麦田的锈病发生率有显著差异。 4.3.3 二项样本假设测验的连续性矫正
二项总体的百分数在性质上属于间断性变异,其分布是间断的二项分布。把它当作连续性的正态分布或t分布处理,结果会有些出入,一般容易犯I类错误。补救的办法是在假设测验时进行连续性矫正。这种矫正在n<30,而n p ?<5时是必须进行的。
??np|?0.5|np一、单个样本百分数假设测验的连续性矫正
tc? snp??np它具有ν=n-1。式中
s??q?np
[例5.11]用基因型纯合的糯玉米和非糯玉米杂交,按遗传学原理,预期F1植株上糯性花粉粒
的p0=0.5,现在一视野中检视20粒花粉,得糯性花粉8粒,试问此结果和理论百分数p0=0.5
是否相符?
?假设 p =8/20=0.4系 p=p0=0.5的一个随机样本,即H0:p=0.5对HA:p≠0.5,显著水平α=0.05 。
? ?1?p??1?0.4?0.6,测验计算:qnp?nq?20?0.5?10??20?0.4?8,??20?8?12s??20?0.4?0.6?2.19 npnqnp|8?10|?0.5
tc??0.68 2.19查附表4,ν=20-1=19,t0.05=2.093,现实得|t|< t0.05,故P>0.05,推断认为实得百分数0.4与理论百分数0.5没有显著差异。
二、两个样本百分数相比较的假设测验的连续性矫正
?? 1 具有y1和n1,取较小值的 p设两个样本百分数中,取较大值的 p 2 具有y2和n2,则经
矫正的tc公式为: y1?0.5y2?0.5? n1n2tc? s?1?p?2p
[例5.12] 用配方农药处理25头棉铃虫,结果死亡15头,存活10头;用乐果处理24头,结果死亡9头,存活15头。问两种处理的杀虫效果是否有显著差异? 假设H0:p1=p2;对HA:p1≠p2。显著水平α=0.05 测验计算: p?15?9?0.49,q?1?0.49?0.5125?24
11 sp0.49?0.51(?)?0.143??p??2425
15?0.59?0.5?
2524?1.29tc? 0.143查附表, ν=24+25-2=47时,t0.05=2.014。现实得|tc|< t0.05,故P>0.05。 推断:接受H0:p1=p2。即承认两种杀虫剂的杀虫效果没有显著差异。 本例若不作连续性矫正,t=(0.60-0.375)/0.143=1.573 大于1.29,增加了否定H0发生第一类错误的可能性。 4.4 参数的区间估计
在一定概率保证下,估计出一个区间以能够覆盖参数μ。这个区间称置信区间,区间的上、下限称为置信限,区间的长度称为置信距。
一般以L1和L2分别表示置信下限和上限。保证该区间能覆盖参数的概率以P=(1-α)表示,称为置信系数或置信度。 4.4.5 区间估计与假设测验
因为置信区间是一定置信度下总体参数的所在范围,故对参数所作假设若恰好落在该范围之内,则这个假设与参数就没有真实的不同,因而接受H0;反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定H0,接受HA。 [例5.21]例5.1已算得新引入春小麦品种的千粒重 y ? 35 .2 0 . 58 , 故其95%置信区间的两个置信限为: g , s y ?L1=35.2-(2.365×0.58)=33.8(g) L2=35.2+(2.365×0.58)=36.6(g)
12