医学统计学
假设检验的基本步骤:
1. 建立检验假设,确定检验水准α
H0 :无效假设(假定所检验的两个总体均数相等) H1 :备择假设(假定所检验的两个总体均数不相等) 单侧检验:推断两总体均数有无差别
双侧检验:根据专业知识推断两总体均数中是否可以认为一个大于(高于)另一个
2. 选择检验方法,计算统计量
根据分析目的、设计类型和资料类型,选择恰当的检验方法,计算相应的统计量(如:t、u、r、f、χ2等)。 3. 确定P值,作出统计结论
用计算出的统计量,根据不同自由度查相应的界值表,确定P值。P值的定义:在H0 所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。结论:
①当计算的统计量≥界值表上所查到的理论值,则P≤α。此时,表示在H0成立的条件下,出现等于及大于现有样本统计量的概率是小概率,按其原理,现有信息不支持H0 ,因而拒绝H0。
②当计算的统计量〈界值表上所查到的理论值,则P 〉α。此时,表示在H0成立的条件下,出现等于及大于现有样本统计量的概率不是小概率,现有信息还不足以拒绝H0 ,因此不拒绝H0。
医学统计学
第五讲 均数差异的假设检验
假设检验的具体方法,通常是以选定的检验统计量来命名的,
如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。
一、 单组完全随机化设计资料均数的t 检验和u检验
从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completely randomized design of single group)。
例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?
这两个均数不等有两个可能: (1)由于抽样误差所致 (2)由于环境条件的影响
如何作出判断呢?在统计上是通过假设检验来回答这个问题。 以下介绍建立假设检验(t检验)的思想、方法与步骤。
1、
建立检验假设和确定检验水准 H0:?1=?0(=72次/分) H1:?1??0(=72次/分)
医学统计学
?=0.05
本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?
? 是未知的,可以假设? 等于某一定值?0 ,? 与?0 的差等于零,
这样的假设称为无差异假设或零假设(null hypothesis) 记为H0:?1=?0
表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis), 符号为H1:?1??0,它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。
检验水准(size of test )亦称显著性水准(significance level),符号为 ?,在实际工作中常取0.05 或 0.01。 2、选定检验方法和计算统计量
本例:n=25 x?74.2次/分 S=6.0次/分 检验统计量公式为:
?
x??0 t? , ??n-1sx
74.2?72.0 ?1.833 , ??25-1?246.0/25
将以上数据代入公式,得:
t?要根据研究类型和统计推断目的选用不同检验方法,不同检验方法有相应的检验统计量,本例的检验统计量t 服从 ?=n-1 的 t 分布。建设检验方法通常是以检验统计量来命名的,故,本例检验称为t检验。
医学统计学
3、确定P值和作出推断结论
查t界值表单侧,t(24,0.05)=2.064,因为t< t(24,0.05) 所以P>0.05。得出结论按?=0.05水准,拒绝H0 ,接受H1。认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。
关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。?取值较小,有利于提高“阳性”统计检验结果的可靠性;?取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。较好的做法是精确地计算出P值, 这会对人们认识你所作的实验有很大的参考价值。
二、 随机化配对设计资料均数的t检验
配对设计资料分三种情况:
(1)配成对子的同对受试对象分别给予两种不同的处理; (2)同一受试对象分别接受两种不同处理; (3)同一受试对象处理前后的比较。
(1)与(2)结果的比较,其目的是推断两种处理的效果有无差别;(3)比较,其目的是推断某种处理有无作用。
因此,应该首先计算出各对差值d的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值d 的总体均数?d=0。故可将配对设计资料的假设检验视为样本均数与总体均数?d=0的比较,配对设计资料以小样本居多,故常用t 检验。其计算公式为:
d??dd , ??n-1t?sd?sd/n
医学统计学
例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E饲料,测得两组大白鼠肝中维生素A的含量如下表,试比较两组大白鼠中维生素A的含量有无差别。
表 不同饲料组大白鼠肝中维生素A的含量(U/g)
大白鼠 配对号 1 2 3 4 5 6 7 8 合计
正常饲料组 3550 2000 3000 3950 3800 3750 3450 3050 ---- 维生素E 缺乏组 2450 2400 1800 3200 3250 2700 2500 1750 差数,d
1100 -400 1200 750 550 1050 950 1300 6500
d2 1210000 160000 1440000 562500 302500 1102500 902500 1690000 7370000
1) H0: ?d=0, H1: ?d? 0, ?=0.05 2) 计算统计量
d6500?d??? 812.5 (u/g)n8Sd?Sdn? ?d2?(?d)2/nn(n?1)?7370000?(6500)2/8?193.1298(u/g)
8?(8?1)t?812.5-0? ?4.2070 ??n?1?7193.1298Sd/nd??d3)确定P值下结论
查t界值表(双側),t > t 0.05, 7 =4.029 P<0.05
结论:按 ?=0.05 水准,拒绝H0,接受H1。结论:可以认为两种饲料喂养的大白鼠肝中维生素A的含量有差别,正常饲料组比缺乏维生素E饲料组的含量要高。