统计计算课程设计

2020-04-14 23:44

题型一:

1、某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差S1=0.985mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl,标准差S2=1.626mg/dl,配对t检验结果,t = –3.098,P < 0.05,故认为脑病病人尿中类固醇排出量高于正常人。

表1 正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果

分 组 正 常 人 脑病病人

尿中类固醇排出量(mg/dl)

2.90 5.28

5.41 8.79

5.48 3.84

4.60 6.46

4.03 3.79

5.10 6.64

4.97 5.89

4.24 4.57

4.37 7.71

3.05 6.02

2.78 4.06

【问题1】 1、该资料属于何种设计方案?

2、该医生的统计处理是否正确?为什么?请用SAS程序和SAS结果解释原因。

【答】

1、该资料属于完全随机设计。

2、该医生的统计处理不正确。因为此数据特点是独立组样本,而该医生的统计处理使用的是成对差值t检验。成对组数据的比较是指在某个观察值内部进行“以前”和“以后”情况的对比。明显这两组是不成对的,所以不能用成对差值t检验。程序如下:

data doctor;

do n=0 to 1; /*n=0,1分别代表正常人,脑病病人*/ do i=1 to 11; input obj @@; output; end; end; cards; 2.90 5.28 ; run;

/*正态性检验*/

proc univariate data=doctor normal plot; var obj; class n; run;

/*T检验*/

proc ttest data=doctor ; class n; var obj; run;

5.41 8.79

5.48 3.84

4.60 6.46

4.03 3.79

5.10 6.64

4.97 5.89

4.24 4.57

4.37 7.71

3.05 6.02

2.78 4.06

输出结果如下:

正常人 脑病病人 图1.1正态性检验

图1.2正常人尿中类固醇排出量QQ图

图1.3脑病人尿中类固醇排出量QQ图

因为是小样本,所以观察Shapiro-Wilk检验结果(图1.1):说明在0.05水平下,正常人的尿中类固醇排出量的正态性统计量W的P值为:0.2259>0.05,脑病病人的尿中类固醇排出量的正态性统计量W的P值为:0.5404>0.05。所以正常人和脑病病人的尿中类固醇排出量都通过正态性检验,即正常人和脑病病人的尿中类固醇排出量的分布都服从正态分布。

我们再观察两个QQ图(图1.3,图1.4),可见两个图的星号大多数覆盖在加号上,这也就说明了正常人和脑病病人的尿中类固醇排出量的分布都服从正态分布。我们于是选择使用两样本T检验。

图1.5T检验输出结果

如图1.5的输出结果,首先是方差齐性检验。从Equality of Variances的表中F统计量值为2.72对应的P值为0.1298,这比显著性水平0.05大。说明了两组样本方差齐性。再进行T检验。由于我们已知方差齐性,我们选用Pooled检验方法,统计量T为-2.56,对应的P值为0.0188小于显著性水平0.05。这说明正常人和脑病病人的尿中类固醇排出量有显著差异。同时我们通过题目中的两组样本的均值,正常人尿中类固醇排出量的均数=4.266mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl。脑病病人尿中类固醇排出量高于正常人。

2、某研究者为研究核黄素缺乏对尿中氨基氮的影响,将60只Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮的三天排出量,结果如表2。该研究者对上述资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。

表2 3组大白鼠在进食一周后尿中氨基氮的三天排出量(mg) 6.02 核黄素缺乏组 8.69 3.23 限食量组 7.14 8.21 不限食量组 9.98 4.04 8.06 5.48 5.19 7.30 6.76 5.08 5.05 4.61 2.49 5.66 3.13 5.34 3.26 7.36 2.50 6.84 3.21 5.20 2.61 5.11 4.90 4.69 3.23 9.33 4.07 11.55 3.44 3.47 5.96 2.59 3.60 3.30 2.36 2.60 4.65 4.99 3.77 3.20 6.94 4.27 4.62 3.14 4.63 8.42 3.70 2.46 4.71 3.82 7.04 4.73 4.77 3.93 6.56 【问题2】 1、这是什么资料? 2、该资料属于何种设计方案?

3、该研究者处理方法是否正确?为什么?请用SAS程序和SAS结果解释原因。

【答】

1、这是一个单因素三水平的方差分析资料。 2、该资料属于单因素三个水平的均衡设计。 3、该研究者处理方法是不正确的,分析如下。

首先我们先对数据进行正态性检验,程序如下:

data researcher;

do n=1 to 3;do i=1 to 20; /*n=1,2,3分别代表核黄素缺乏组,限食量组,不限食量组*/ input Wistar@@; output; end;end; cards; 6.02 8.69 3.23 7.14 8.21 9.98 ; run;

proc univariate data=researcher normal; class n;

var Wistar;run;

3.70 3.44 3.47 2.49 5.66 4.04

2.46 5.96 2.59 3.13 5.34 8.06

4.71 3.60 3.30 3.26 7.36 5.48

3.82 2.36 2.60 2.50 6.84 5.19

7.04 4.65 4.99 3.21 5.20 7.30

4.73 3.77 3.20 2.61 5.11 6.76

4.77 6.94 4.27 4.90 4.69 5.08

3.93 4.62 3.14 3.23 9.33 5.05

6.56 4.63 8.42 4.07 11.55 4.61

正态性检验结果如下:

黄素缺乏组 限食量组 不限食量组 图2.1正态性检验

由于样本量为3组每组20个样本,属于小样本,所以观察Shapiro-Wilk检验结果:说明在显著性0.05水平下,核黄素缺乏饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)与限食量饲料组、不限食量饲料组的正态性统计量W值分别为0.941,0.741,0.889,对应的P值分别为:0.2526,0.0001,0.0256。只有核黄素缺乏饲料组对应的P值是大于0.05,限食量饲料组、不限食量饲料组对应的P值都小于0.05,可见除核黄素缺乏饲料组外,限食量饲料组和不限食量饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)都不通过正态性检验,即核黄素缺乏饲料组的样本是服从正态分布的,而限食量饲料组和不限食量饲料组的样本的分布不是正态分布。

显然研究者的处理方法不正确;因为两独立组样本均数t检验要求每组观察值是来自正态分布的总体的,而经检验证明,上述的三组数据并不都服从正态分布,所以不可以采用两独立组样本均数t检验;而且对多个总体的均值进行比较,应用方差分析是更加常用的方法,所以此研究应该考虑采用非参数方差分析。

程序如下

/*非参数方差分析*/

proc npar1way data=researcher wilcoxon; class n; var Wistar; run;

输出结果如下:

图2.2npar1way过程输出结果

结果表明三组的秩和分别为590,359,881,在原假设为三组同一分布下的期望值都为610,标准差为63.77,平均秩分别为29.5,17.95,44.0。其Z =22.4337, Prob > |Z| < 0.0001。三组之间均数差异均有统计学意义。说明这三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)是有差别的。

最后我们用Bonferroni法进行多重比较来考察三组中差别所在,程序如下:

proc rank data=researcher out=reout; var Wistar; ranks r;

proc anova data=reout; class n; model r=n; means n/bon; run;

输出结果如下:

图2.3多重比较结果

结果显示这三组不同饲料组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)两两不同。并且可以看出不限食量组的大白鼠进食一周后尿中氨基氮的三天排出量(mg)最大,核黄素缺乏组次之、限食量组最小。

3、某医师用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表3。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t =2.460,P<0.05,差异有统计学意义,故认为治疗前后血中HCG的含量有差别。

表3 灌注化疗前后HCG含量测定结果(pmol/L)

病例号 1 2 3 4 5 6 7 8

灌注前(X1) 1280000 75500 12450 1500000 10000 9700 15588 4223

灌注后(X2) 210000 3300 2210 9.3 2500 1203 4825 914

lgX1 6.1072 4.8779 4.0952 6.1761 4.0000 3.9868 4.1928 3.6256

lgX2 5.3222 3.5185 3.3444 0.9685 3.3979 3.0803 3.6835 2.9609

【问题3】 1、这是什么资料?

2、该实验属于何种设计方案?

3、该医师统计方法是否正确?为什么?请用SAS程序和SAS结果解释原因。

【答】

1、这是成对组(配对)数据的资料。


统计计算课程设计.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:历年教育学考点归纳整理集

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: