生物统计学复习提纲(2)

2019-04-15 12:16

? 成对样本的检验,如减肥效果的检验。 Paired-Sample T Test

例1: 甲乙两个班某次考试的数学成绩见下表1,两个班成绩的正态检验(SPSS Explore)结果见表2。对两个班平均成绩的检验(SPSS:Independent Samples Test)输出结果见表3。

表1,两个班的数学成绩 Class Score 1 85 73 86 77 94 68 82 83 90 88 76 85 87 74 85 80 82 88 90 93 2 75 90 62 98 73 75 75 76 83 66 65 78 80 68 87 74 64 68 72 80 表2 Tests of Normality Kolmogorov-Smirnova Shapiro-Wilk class Statistic df Sig. Statistic df Sig. score 1 0.14722 20 0.200* 0.963594 20 0.61787 2 0.12611 20 0.200* 0.95318 20 0.41796 * This is a lower bound of the true significance. a

Lilliefors Significance Correction

1.当样本量较大时,采用Kolmogorov-Smirnov法进行正态性检验;

2. 当样本量较小时,采用Shapiro-Wilk法,本例n=20,W统计量(Statistic)分别为0.963594,0.95318,P>0.05,数据均为正态资料。

表3 Independent Samples Test score Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F 0.732998 Sig. 0.397 t-test for Equality of Means t 3.056 3.056 df 38 35.290 Sig.(2-tailed) 0.004089 0.004254 1.Levene?s方差齐性检验,用于判断两总体方差是否齐。假设两个班成绩方差均相等,检验结果为F=0.733, p=0.397,不能拒绝假设,两总体方差齐相等。 2. 假设两个班成绩均值相等,选用齐时的t检验结果,即上面一行列出的t=3.056,df=38,p=0.004,拒绝假设,两个班的成绩明显不同。

第五章 方差分析

目的:用于推断多个总体均数有无差异。 方差分析的应用条件

? 各样本是相互独立的随机样本; ? 各样本来自正态总体; ? 各处理组总体方差相等。

方差分析的步骤

首先,提出一个原假设,如H0:μ1=μ2=...=μi, 对应的备选假设H1:μ1,μ2,...,μi不全相等;

第二,计算F值;

第三,确定显著性水平(α=0.05或0.01);

第四,查F值表,确定p值。如果F值大于某个临界值,表示处理组间的效应不同;如果F值接近甚至小于某个临界值,表示处理组间效应相同。

第五,如果F检验表明各处理组间的效应不全同,选择一种控制累积Ⅰ类错误概率增大的方法,如LSD法、Duncan法和S-N-K法,进行均数间的两两比较。

当组数为2时,方差分析与两均数比较的t检验是等价的,对同一资料,有

t?F。

为什么一般t检验用作多重比较是错误的?

当有k个均数需作两两比较时,比较的次数共有c?Ck2?k!2!(k?2)! =

k(k-1)/2次。

设每次检验所用I类错误的概率水准为α,累积I类错误的概率为α?,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积I类错误概率α?与c有下列关系:α?=1-(1-α)c。

例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错误的概率为α?=1-(1-0.05)3 =1-(0.95)3 = 0.143。

多个样本均数间的两两比较或称多重比较(multiple comparison),也叫post hoc检验,多重比较控制累积Ⅰ类错误概率增大的方法主要有: LSD法、Duncan法和S-N-K法。

当处理数k≥3时,三种检验的显著尺度关系为:LSD法≤Duncan法≤S-N-K法。

用LSD法检验显著的差数,用Duncan法或S-N-K法检验则未必显著; 用S-N-K法检验显著的差数,用LSD法检验则必然显著。

方差分析例题:

例,不同人群血清1.5-脱水葡萄糖醇(AC)水平(?mol/L),如下表

组别

正常对照 46.15 82.31 54.67 70.37 68.80 80.57 76.66 77.74 88.73 74.62

糖尿病 30.82 56.83 32.01 41.26 12.25 33.62 21.69 23.33 47.62 30.57

糖尿病并肾衰

49.41 32.96 42.83 21.43 44.06 47.85 40.98 3.89 23.77 28.95

肾移植 90.89 71.16 82.99 57.32 84.47 89.03 80.78 36.27 60.13 66.34

观测值 AC

各组的正态检验(SPSS Explore)结果见表2。

Tests of Normality

AC group 1 2 3 4 Kolmogorov-Smirnov a Statistic df 0.200344 10 0.180936 10 0.196243 10 0.196284 10 Sig. 0.200* 0.200 0.200 0.200* **Shapiro-Wilk Statistic df Sig. 0.299615 0.914022 0.324529 0.324379 0.912639 10 0.972621 10 0.915965 10 0.915946 10 * This is a lower bound of the true significance. a Lilliefors Significance Correction

本例n=10,Shapiro-Wilk检验P均大于0.05,数据均为正态资料。

AC

Test of Homogeneity of Variances

Levene Statistic .550 df1 3 df2 36 Sig. .651 假设各组方差均相等,F3,36=0.55,P=0.651,不能拒绝假设。故各组方差相等。

AC

ANOVA

Between Groups Within Groups Total

Sum of Squares

14973.825 7533.919 22507.744

df 3 36 39

Mean Square

4991.275 209.276

F 23.850

Sig. .000

假设各组AC均值均相等,F3,36=23.85, P<0.001,拒绝假设,故各组均值不全相等。

Homogeneous Subsets

AC Student-Newman-Keuls Sig. group 2 3 4 1 N 10 10 10 10 0.925038 Subset for alpha = .05 1 33 33.613 71.938 72.062 0.984814 2 当检验水平为0.05时,第2组与第3组AC均值相等,第1组与第4组AC均值没有有统计学差异,而第2、3组与第1、4组AC均值有统计学差异。

第六章 多因素方差分析

协方差分析

协方差分析是将回归分析与方差分析结合在一起的统计方法,用来消除混杂因素(协变量,连续型变量)对分析指标的影响。

各组y的修正值:

yi?.?yi.?byx(e)(xi.?x..)

byx(e): 误差项回归系数

协方差分析例题

不同年龄体重正常与超重组的血清胆固醇含量见右图,试比较两组血清胆固醇含量有无差异。

SPSS的分析结果如下:

Descriptive StatisticsDependent Variable: 胆固醇体重组12TotalMean5.0926.7855.938Std. Deviation1.30671.44161.6005N131326 各组y的平均值。 Tests of Between-Subjects EffectsDependent Variable: 胆固醇Type III Sumof Squares42.9951.5274.45824.38021.047980.94064.042aSourceCorrected ModelInterceptgroupageErrorTotalCorrected Totaldf2111232625Mean Square21.4981.5274.45824.380.915F23.4931.6684.87226.642Sig..000.209.038.000a. R Squared = .671 (Adjusted R Squared = .643) 两组血清胆固醇含量有显著差异(F1,23=4.872,p=0.038)。 Estimated Marginal Means

EstimatesDependent Variable: 胆固醇95% Confidence Interval体重组12Mean5.4916.386aaStd. Error.276.276Lower Bound4.9195.815Upper Bound6.0626.958a. Covariates appearing in the model are evaluated at the following values: 年龄 = 50.23. 按平均年龄50.23岁得到胆固醇含量的修正均数。 Descriptives 体重组 年龄

1 2

Mean Mean

Statistic 46.00 54.46

Std. Error 2.136 3.614

各组x的平均值。

根据1组或2组的下x和y的均值,可以计算误差项回归系数byx(e): y1?y1'5.092?5.491b?,b??0.09432 yx(e)yx(e)x1?x46.00?50.23

校正后的回归方程 adjchol = chol - 0.09432*(age - 50.23)。


生物统计学复习提纲(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:电力测量高升专作业题

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: