第十二章 秩和检验
第十二章 秩和检验
假设检验通常可划分为参数检验(parametric test)和非参数检验(nonparametric test)两大类。
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。前面章节介绍的t检验和方差分析均要求样本来自正态总体,属于参数检验。非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。
非参数检验具有广泛的适用性。由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。由于非参数检验没有利用观察值的具体数值,而只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。但当总体分布不明确时,则应采用非参数检验。尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。本章介绍在非参数检验中占有重要地位且检验功效相对较高的秩和检验。
第一节 Wilcoxon符号秩和检验
1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon singned-rank test),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。
一、配对设计的两样本比较
(一) 本法的基本思想与步骤
配对设计资料主要是对差值进行分析。通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。现以例12.1说明其基本思想与步骤。
例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg
12-1
第十二章 秩和检验
/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。问两种方法的测定结果有无差别?
表12.1 甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)
测定点序号 (1) 1 2 3 4 5 6 7 8 9 10 合计
水中砷含量 甲法 (2) 0.010 0.060 0.320 0.150 0.005 0.700 0.011 0.240 1.010 0.330 -
乙法 (3) 0.015 0.070 0.300 0.170 0.005 0.600 0.010 0.255 1.245 0.305 -
差值di
(4)=(2)-(3) -0.005 -0.010 0.020 -0.020 0.000 0.100 0.001 -0.015 -0.235 0.025 -
正差值秩次
(5) - - 5.5 - - 8 1 - - 7 21.5(T?)
负差值秩次
(6) 2 3 - 5.5 - - - 4 9 - 23.5(T-)
本例为定量数据配对设计的小样本资料,其配对差值经正态性检验得
W?0.717,P?0.001,即差值不服从正态分布,故不宜选用配对t检验,而应
使用Wilcoxon符号秩和检验。
1. 建立检验假设,确定检验水准
H0:两种方法测定结果差值的总体中位数等于0 H1:两种方法测量结果差值的总体中位数不等于0
??0.05
2. 计算检验统计量T值
(1) 求差值di,见表12.1第(4)栏。 (2) 编秩 依差值的绝对值由小到大编秩。
当差值为0,舍去不计,n随之减少;当差值绝对值相等,若符号不同,求平均秩次;若符号相同,既可顺次编秩,也可求平均秩次,并将各秩次冠以原差值的正、负号。
本例,因5号测定点差值为0,不参与编秩,n随之减1,即有效对子数为9。编秩时,差值为“0.020”和“-0.020”所占位次为5、6,但由于两个差值符号不同,必须取平均秩次(5?6)/2?5.5。
12-2
第十二章 秩和检验
(3) 分别求正、负秩和 计算正差值的秩和T?和负差值的秩和T-。 由于总有T??T??n(n?1)/2,故T?大时,T-必然小;反之T?小时,T-必然大。本例,T??21.5,T-?23.5,T??T??9(9?1)/2?45,表明秩和计算无误。
(4) 确定检验统计量T 任取T?或T-作为检验统计量T。 本例取T?21.5或T?23.5。 3. 确定P值,作出统计推断 (1) 查表法:
当n?50时,根据n和T查附表10,T界值表(配对比较的符号秩和检验用)。 查表时,自左侧找到n,用所得统计量T值与相邻一栏的界值相比较,若T值在上、下界值范围内,其P值大于相应的概率;若T值恰好等于界值,其P值一般等于相应概率;若T值在上、下界值范围外,其P值小于相应概率,此时右移一栏,再做比较,直至较好地估计出P值。
由附表10可知,按照??0.05水准,当n?5时,配对符号秩和检验不能得出双侧有统计学意义的概率,故n必须大于5。
本例,由n?10 ,T?21.5或T?23.5查附表10,得P?0.10。按照??0.05水准不拒绝H0,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。
(2) 正态近似法:
T分布逐渐逼近均数为n(n?1)/4,随着n的增大,方差为n(n?1)(2n?1)/24的
正态分布。当n?50时,近似程度较满意,可由公式(12.1)计算标准正态统计量:
Z=T?n(n?1)/4?0.5n(n?1)(2n?1)/24 (12.1)
式中0.5为连续性校正数,因为Z值是连续的,而T值却不连续。
排序时,出现相同秩次的现象称为相持(tie)。当相持的情形较多时(如个体数超过25%),按式(12.1)计算的Z值偏小,可用公式(12.2)计算校正的统计量Zc,经校正后,Zc适当增大,P值相应减小。
Zc=T?n(n?1)/?43j0.5n(n?1)(2n?1)?(t?tj)?2448 (12.2)
12-3
第十二章 秩和检验
式中tj(j=1,2,…)为第j个相同秩次(即平均秩次)的个数,例如有2个差值为“1.5”,3个差值为“6”,5个差值为“13”,则t1=2,t2=3,t3=5,故有
333)(2?2)+(?3?(tj?tj=33)?+(53 5,若无相同秩次,则)=150?(tj?tj)=0,Zc=Z。
Wilcoxon配对符号秩和检验的基本思想:在配对样本中,由于随机误差的存在,其对差值的影响不可避免。假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n?1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。
二、单一样本与总体中位数比较
Wilcoxon符号秩和检验的目的是推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别,常用于不满足单样本t检验应用条件的资料。
单样本资料符号秩和检验的方法步骤见例12.2。
例12.2 某医生从其接诊的不明原因脱发患者中随机抽取14例,测得其发铜含量(μg/g)见表12.2。已知该地健康人群发铜含量的中位数为11.2μg/g。问脱发患者发铜含量是否低于健康人群?
表12.2 14名不明原因脱发患者发铜含量(μg/g)测定结果
发铜含量xi
(1) 6.11 6.20 6.27 6.58
6.78 7.22 7.31 8.52 9.59 9.72 10.63 11.16 11.23
差值di (2)=(1)-11.2 -5.09 -5.00 -4.93 -4.62 -4.42 -3.98 -3.89 -2.68 -1.61 -1.48 -0.57 -0.04 0.03
12-4
正差值秩次
(3) - - - - - - - - - - - - 1
负差值秩次
(4) 14 13 12 11 10 9 8 7 6 5 4 2 -
第十二章 秩和检验
11.32 合计
0.12 -
3 4(T?)
- 101(T-)
根据专业知识可知,发铜含量值呈明显偏态分布,表12.2第(2)栏为样本各观察值与已知总体中位数的差值,对di做正态性检验得W?0.861,P?0.031,不满足单样本t检验条件,故选用Wilcoxon符号秩和检验。
1. 建立检验假设,确定检验水准
H0:差值的总体中位数等于0,即脱发患者发铜含量与该地健康人群相同 H1:差值的总体中位数小于0,即脱发患者发铜含量低于该地健康人群 单侧??0.05 2. 计算检验统计量
(1) 求差值 di?xi?11.,见表12.2第(2)栏。 2(2) 编秩 依差值的绝对值由小到大编秩。本例,各观察值差值的秩次见表12.2第(3)、(4)栏。
(3) 分别求正、负秩和 本例,T??4,T-?101,T??T??表明秩和计算无误。
(4) 确定检验统计量T 本例,T?T??4或T?T??101。 3. 确定P值,作出统计推断
本例,由n?14,T?4或T?101查附表10,得单侧P?0.01。按照??0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为脱发患者发铜含量低于该地健康人群 。
14(14?1)?105, 2第二节 成组设计两样本比较的秩和检验
Wilcoxon秩和检验(Wilcoxon rank sum test),目的是推断连续型变量资料或有序变量资料的两个独立样本代表的总体分布位置是否有差别。
一、原始数据的两样本比较
原始数据为连续性变量资料,方法步骤见例12.3。
例12.3 某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的
12-5