第十三章 非参数检验
假设检验的方法有两种:参数检验(Z、t、F)根据样本的信息对相应的总体参数(?、σ、p)的假设检验。这种检验是以样本所属的总体呈正态分布,两个总体或几个总体方差齐性为假定条件。它适应于等距变量和比率变量的资料。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于等距变量和比率变量的资料。它不需要对两个总体方差作齐性的假定,计算简单,适用于小样本资料。应用范围较参数检验广泛,但其灵敏性和精确度不如参数检验。
第一节 符号检验是通过 对两个相关样本的每对数据之差的符号进行检验,以比较这两个样本差异的显著性。1、小样本的情况:n<25时,可用查表法进行符号检验。 检验步骤:
1、提出假设:H0:P(X1>X2)=P(X1 求差数,并记符号,较小的记为r,实际的r值越大于r的临界值,差异越不显著。 二、大样本的情况:当n>25时,二项分布接近于正态分布。检验步骤: 2、提出假设: 3、H0:P(X1>X2)=P(X1 (r?0.5)?Z?12nn2 n当r>时,则r-0.5,当r<时,r+0.5,r表示n+与 n-中数值较小的一个。 22n符号检验的优点是无须对所要检验的两个总体分布形态以及方差的齐性作任何假定,并且计算简单迅速,但是它只考虑符号的正负,不考虑差数数值的大小,因而失去了一部分样本所提供的信息。对于同一组数据,除小样本外,一般不采用符号检验。 第二节 符号秩次检验 为了克服符号检验的缺点,当比较两个相关样本的差异时,,将两个样本每对数据差的绝对值从小到大排列,并赋予每一个差数以秩次(等级),然后再给差数记上正负号。威尔科克逊 一、小样本:n<25时,可用查表法。 1、提出假设: 2、H0:P(X1>X2)=P(X1 2、计算每对数值的差数,但先不记符号3、编秩次,差数为0不记,从小到大顺序4、记号:按差数的正负,给秩次记上+、-号5、求秩次和,较小的一个用T表示。 二、大样本:n>25,二项分布接近于正态。 1、提出假设: H0:P(X1>X2)=P(X1 2、计算每对数值的差数,但先不记符号3、编秩次,差数为0不记,从小到大顺序4、记号:按差数的正负,给秩次记上+、-号5、求秩次和,较小的一个用T表示。 Z?T?UT?T?T?n(n?1)/4n(n?1)(2n?1)24 第三节 秩和检验 当比较两个独立样本的差异时,可以采用曼-惠特尼U检验法 一、小样本:当两个独立的样本容量n1与n2都小于10,并且n1≤n2时,可将两个样本的数据合在一起按数据从小到大的顺序给每一个数据编秩次。计算样本容量较小一组的秩次和,并用T表示。 二、大样本:当两个独立的样本容量n1与n2都大于10,T分布接近于正态。 1、提出假设: 2、H0:相同 H1:不相同 Z?T?UT2、将二者数字合在一起编秩次。3、求秩和 ?T?T?n1(n1?n2?1)/2n1n2(n1?n2?1)12 中位数检验:次序变量数据常以中位数作为集中量,以中分位距作为差异量。对两个或几个独立样本中位数的比较,可以采用非参数检验法。中位数的检验将各组样本数据合在一起找出共同的中位数,然后 分别计算每个样本在共同中位数上下的频数,再进行rc表X2 检验。 一、两个样本中位数的检验 1、提出假设: H0:相等 H1:不相等 2、求共同的中位数3、统计中位数上下的频数 4、计算X值:df=1,N<30可采用四格表缩减校正公式X2 2?2(a?b)(a?c)(b?d)(c?d)(/ad?bc/?N)N2统计决断: 二、多组中位数的检验:用3*2表的X2缩减公式检验 1、提出假设: H0:相等 H1:不相等 2、求共同的中位数3、统计中位数上下的频数4、计算X值:第五节 单向秩次方差分析 对于几个独立样本差异的显著性,可以用克鲁斯尔和沃利斯所提出的单向秩次方差分析进行检验。这种方法又称H检验法。它相当于对多组平均数所进行的参数的方差分析。它是用秩次进行的非参数的方差分析。 一、样本容量较小或组数较小的情况:当各组容量n≤5,或者样本组数K≤3,可用下式作为检验统计量。 H?12N(N?1)2 X2?N(?f0nrnc?1) ?R2n?3(N?1) N表示各组频数总和,n(n1= n2= n3= )表 示每个小组频数总和.R表示每个组的秩次和(R1= R2= R3= ) 1、提出假设: H0:相等 H1:不相等 2、编秩次,求其和,分别计算各组的秩次和, 二、样本容量较大或组数较多的情况 当样本容量n>5或样本组数K>3时,可进行X检验(df=K-1) 第六节 双向秩次方差分析:单向秩次方差分析是处理几个独立样本的资料,双向秩次方差,是处理几个相关样本的资料。 一、样本容量较小及实验次数较少的情况 当样本容量n≤9,K=3;n≤4,K=4时,用公式:X1、提出假设:H0:相等 H1:不相等 2、编秩次,求其和,分别计算各组的秩次和, 二.样本容量较大或实验次数较多的情况 当K=3,n<9;K=4,n>4,或K>4时,X2r的抽样分布接近于df=K-1的X2的分布。于是可以用X2近似处理:X2r2r2 H?12N(N?1)?R2n?3(N?1)与X2值比较。 ??RnK(K?1)122?3n(K?1) ?12nK(K?1)?R22 X(df=K-1) ?3n(K?1)第十四章 抽样设计:推断的可靠性与以下几种因素有关:①数据的质量,即所获得数据能否准确映所观察或测试的某种属性的实际情况;②运用统计方法及数据处理的准确性;③样本对总体的代表性。可见,抽样设计既是教育科研定量分析中的首要环节,又是关系到统计推断可靠性的重要因素。而样本对总体的代表性,既涉及到抽样的方式,又涉及到样本的容量。 第一节 抽样的方法: 单纯随机抽样:如果总体中每个个体被抽到的机会是均等的,(即抽样的随机性),并且在抽取一个个体之后总体内成份不变(抽样的独立性)。这种抽样方法称为单纯随机抽样。 抽签法:先将总体中每一个个体都 编上号码,再将每个号码写在签上,将签充分混合后,从中抽取n个(样本容量)签,与被抽到的签号相应的个体就进入样本。随机数目表法随机数骰子法,计算器随机数法。 二、机械抽样:把总体中的所有个体按一定顺序编号,然后依固定的间隔取样(间隔的大小视所需样本容量与总体中个体数目比率而定)。机械抽样比单纯随机抽样能够保证抽到的个体在总体中的分布比较均匀,而单纯随机抽样比机械抽样的随机性强。 三、分层抽样:按与研究内容有关的因素或指标,先将总体划分成几部分(即几个层),然后从各部分(即几个层)中进行单纯随机抽样或机械随机抽样。原则是各层内部的差异要小,层与层之间的差异差异要大。1、按各层的人数比率分配:当总体σ未知时,从各层所抽的人数比率都应当等于样本容量n与总体N之比: nN?n1N1?n2N2?n3N3 2、最优配置法:在从各层抽取对象时,既考虑各层人数比率,又考 h虑各层标准差大小。n?nNh?hh?N?在标准差大的层里所抽的人数比率大,标准差小 的层里抽到的人数比率小。