数据如下数据步所示:
data cows;
input herdsize disease numcell; label herdsize='牛群大小' disease = '患病程度'; cards; 1 0 9 1 1 5 1 2 9 2 0 18 2 1 4 2 2 19 3 0 11 3 1 88 3 2 136 ; run;
用FREQ过程在TABLES语句中加上MEASURES选项就可以计算Kendall Tau-b统计量:
proc freq data=cows;
tables herdsize * disease / measures expected nopercent norow nocol; weight numcell; title '奶牛疾病数据分析'; run;
结果如下:
算出的Kendall Tau-b统计量值为0.2173,渐近标准误差(ASR)为0.0606,用统计量值加减两倍标准误差作为Kendall Tau-b的95%置信区间,可算得(0.0961,0.3385)在零点右边,所以可认为奶牛患病程度与种群大小有正的关联。事实上,我们从列联表中实际频数与期望频数的对比也可以看出,小的种群患病比期望值轻,大的种群患病比期望值重,即患病程度与种群大小有正的关联。
123
4.4.4 用Analyst作列联表分析
Analyst的“Statistics-Table Analysis”可以进行列联表分析。比如,对吸烟危害的数据集BRON选此菜单,出现如图4-14的对话框,这里要指定行变量、列变量,如果数据集中已经是表格则需要输入单元格计数变量(Cell Counts)。这里的Tables按钮用来指定画的表格中出现的内容,如有无各百分比、期望频数等。这里的Statistics按钮指定对列联表要作的分析,比如独立性的X2检验,计算关联性量度,进行精确检验,等等,见图4-15所示的对话框。
Analyst调用PROC FREQ进如果要对上面奶牛的例子计算关联性量度就要用到这个对话框。
行计算,所以结果与上面编程的结果相同。
图4-14 Analyst:列联表分析 图4-15 Analyst:列联表统计
练习
1. 下面是一组草原隼的鸟巢高度的数据,试检验其分布是否正态。 15 3.5 3.5 7 1 7 5.75 27 15 8 4.75 7.5 4.25 6.25 5.75 5 8.5 9 6.25 5.5 4 7.5 8.75 6.5 4 5.25 3 12 3.75 4.75 6.25 3.25 2.5
2. 有若干人参加了一个减肥锻炼,在一年后测量了 他们的身体脂肪含量,结果如下(身体脂肪含量的 百分数):
男,r生组:13.3 19 20 8 18 22 20 31 21 12 16 12 24 女,r生组:22 26 16 12 21.7 23.2 21 28 30 23 124
比较这些人中男性和女性的身体脂肪含量有无 显著差异。 3. 下表为某基础统计课程两次考试的学生成绩。
两次考试考同样的知识。试比较这两次考试难易程度有无显著差异。 学号 第一次 第二次 学号 第一次 第二次 1 93 98 11 88 83 2 88 74 12 91 94 3 89 67 13 85 89 4 88 92 14 70 78 5 67 83 15 90 96 6 89 90 16 90 93 7 83 74 17 94 81 8 94 97 18 67 81 9 89 96 19 87 93 10 55 81 20 83 91 4. 为研究溶菌酶水平在患胃溃疡的病人与正常人之间有无显著差异,测量了一组病人和 一组正常人的溶菌酶水平,结果见下表。是检验两者的溶菌酶水平有无显著差异(水平0.05)。
胃溃疡病人组:
0.2 10.4 0.3 10.9 0.4 11.3 1.1 12.4 2.0 16.2 2.1 17.6 3.3 18.9 3.8 20.7 4.5 24.0 4.8 25.4 4.9 40.0 5.0 42.2 5.3 50.0 7.5 60.0 9.8 对照组:
0.2 5.4 0.3 5.7 0.4 5.8 0.7 7.5 1.2 8.7 1.5 8.8 1.5 9.1 1.9 10.3 2.0 15.6 2.4 16.1 2.5 16.5 2.8 16.7 3.6 20.0 4.8 20.7 4.8 33.0
提示:要考虑分布是否正态。
5. 为了考察两种测量萘含量的液体层析方法:标准方法和高压方法的测量结果有无显著差异,取了10份试样,每份分为两半,一半用标准方法测量,一半用高压方法测量,每个试样的两个结果如下表,试检验这两种化验方法有无显著差异(水平0.05):
标准 高压 14.7 12.1 14.0 10.9 12.9 13.1 16.2 14.5 10.2 9.6 12.4 11.2 12.0 9.8 14.8 13.7 11.8 12.0 9.7 9.1 6. 使用放射性金195作示踪元素注射到血液中,下表为注射x天后血液内残留的金元素百分比y,取了10个血样,对数据分别拟合线性回归、负指数关系y?Ae?bx,并使用各种非参数曲线拟合方法拟合曲线。比较各结果。
x y 1 94.5 1 86.4 2 71 2 80.5 2 81.4 3 67.4 5 49.3 6 46.8 6 42.3 7 36.6 7. 对数据集SASUSER.GPA中的大学学科平均成绩GPA建模,HSS、用高中成绩HSM、HSE作为自变量。 简述回归的结果。试改进模型。使用SAS/INSIGHT和REG过程两种办法。 8. 为试制某种化工产品,在三种不同温度、四种不同压力下试验,每一水平组合重复两次,得到产品的收率数据如下(%):
温度 压力 1 1 2 3 52,57 50,52 63,58 2 42,45 47,45 54,59 3 41,45 47,48 57,60 4 48,45 53,30 58,59 125
试在0.05水平下进行方差分析并简述结果。
9. 为了考察法院判决是否与被告种族有关,调查了326位被告的判决情况: 有罪 无罪 黑人 17 149 白人 19 141 试在0.05水平下检验判决结果与被告种族是否独立。
126