第二讲 非参数检验
1. 实验目的
1.了解非参数假设检验基本思想;
2.会用SAS软件中的proc npar1way过程进行非参数假设检验和proc freq过程进行列联表的独立性检验。
2. 实验要求
1.会用SAS软件建立数据集,并进行统计分析;
2.掌握proc npar1way过程进行非参数假设检验的基本步骤; 3.掌握proc freq过程进行列联表的独立性检验的基本步骤。
3. 实验基本原理
3.1 符号检验
H0:两种方法的处理效果无显著性差异
?1令Ii???0统计量SN第i个个体中新方法优于对照方法第i个个体中新方法劣于对照方法Ni?1,2,,N
??Ii
i?1SN表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对
照方法,则SN的值应明显偏大。因此,若对给定的置信水平则拒绝H0。
?,有 P?SN?c???,
1H0为真时,(1)SN服从二项分布b(N,)E(SN)?2NN,Var(SN)?24。拒绝域为:
?SNSN?c?
(2)由中心极限定理可知,当
N??,SN?的零分布趋于标准正态分布。1N2N2?N?S?N???2?u?S拒绝域为:?N?? 1??N??2??3.2 Wilcoxon秩和检验 (1)单边假设检验
H0:两种方法的处理效果无显著性差异 as H1::新方法优于对照方法。
用于检验H0的统计量为:Ws??Ii
i?1n若对给定的置信水平?,有
P?Ws?c???,则拒绝H0。且Ws的分布列为:
#{w;n,m}
PH0{Ws?w}??N??n???根据观测结果计算Ws的观测值Ws0,计算检验的p值:
p?PH0{Ws?ws}?k?ws?PH0{Ws?k}
然后将p值与显著水平?作比较,若p??,则拒绝H0,否则接受H0。
(2)双边假设检验
给定的显著水平?,c1和c2应该满足:
PH0{WA?c1}?PH0{WA?c2}??
仅由上式还不能唯一确定c1和c2,当我们对两种方法谁优谁劣不得而知时,通常取
PH0{WA?c1}?PH0{WA?c2}??2
?A,计算概率值 若利用p值进行检验,设WA的观测值为
PH0{WA??A}或PH0{WA??A}
由对称性可知,检验的p值为上述两概率中小于1/2的那一个的2倍。例如
10?PH{WA??A}<则p?2PH{WA??A}。求出p值后,若p
002绝H0,否则接受。
(3)列联表的独立性检验
H0:方法的处理效果无显著性差异
?ijk:表示格子概率,mijk?n?ijk表示三维列联表中事件发生的理论频数。将概率用相
应的频率频率去估计。
2?(n?m)ijkijk2~?2(f) 令Q?????ijkmi?1j?1k?1rst其中:f?(rst?1)?(为检验特定独立性所需要独立估计的概率数目)
将样本数据代入统计量进行检验。然后将P与显著水平?作比较,若p??,拒绝H0,否则接受H0。
4. 实验相关SAS知识
(1)独立样本的秩检验——proc npar1way过程
proc npar1way过程的基本语句形式为 proc npar1way [options];
class variables;(proc npar1way过程不可缺少的语句) exact;(求出检验的精确p值) var variables;
其中“options”可包含以下选项的部分或全部: ①DATA=数据集名:指定要分析的数据集。
②ANOVA:对原始数据执行标准的单因素方差分析。
③WILCOXON:进行wilcoxon型秩和检验。当有两种处理方法时,进行的是wilcoxon秩和检验;当有多种处理方法时,进行Kruskall-Wallis检验。
④EDF:进行基于样本经验分布函数的非参数检验,包括Smirnov检验。
若省略这些选项,SAS系统将给出所有基于秩以及经验分布函数的非参数检验方法的分析结果。
(2)列联表的独立性检验
proc freq过程的基本语句形式为
proc freq [options];
tables variable1*variable2*??/options; weight variable;
其中“options”可包含以下选项的部分或全部: ①DATA=数据集名:指定要分析的数据集。
②chisq:要求对生成的每个二维列联表的独立性作?2检验,并计算依赖于?2统计量的关联度。
③cellchi2:要求输出每个格子对总?2统计量的贡献。 ④expected:在独立性假定下输出各格子的期望频数。 ⑤deviation:要求输出每个格子上的频数与期望频数之差。 ⑥nocol:不输出二维列联表各格子的列百分数。 ⑦norow: 不输出二维列联表各格子的行百分数。 ⑧nofreq:不输出格子频数。
⑨nopercent:不输出各格子的百分数。
⑩noprint:不输出列联表,但允许输出各分析结果。
5. 实验举例
5.1 Wilcoxon秩和检验(单边和双边假设检验)
例1 为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢
复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下: 原方法:20,21,24,30,32,36,40,48,54 新方法:19,22,25,26,28,29,34,37,38
在??0.05下检验新方法是否显著的缩短了病人手术后的恢复时间。 Wilcoxon秩和单边假设检验SAS程序如下: data a1;
input method $ time@@; cards;
a 20 a 21 a 24 a 30 a 32 a 36 a 40 a 48 a 54 b 19 b 22 b 25 b 26 b 28 b 29 b 34 b 37 b 38 ;
proc npar1way data=a1 wilcoxon; class method; exact; run;
结果显示p?0.2181??,故接受原假设H0,即认为病人手术后采用新旧护理方法对其恢复时间无显著差异。
5.2.Smirnov检验
例2(数据见教材)SAS程序如下:
data a1;
input group $ time@@; cards;
a 6.8 a 3.1 a 5.8 a 4.5 a 3.3 a 4.7 a 4.2 a 4.9 b 4.4 b 2.5 b 2.8 b 2.1 b 6.6 b 0.0 b 4.8 b 2.3 ;
proc npar1way data=a1 edf; class group; exact; var time; run;
运行结果显示p=0.0879>0.05,即认为两种止痛药效果无显著差异;但在0.1水平上可认为两者有显著差异。
5.3.Wilcoxon符号秩检验 例3(见教材例题2.8)SAS程序如下:
data a;
input id product1 product2; cards; 1 459 414 2 367 306 3 303 321 4 392 443 5 310 281 6 342 301 7 421 353 8 446 391 9 430 405 10 412 390 ; data b;