医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习(4)

2019-03-29 14:25

第四章 定量资料的统计描述

OldNew: 点击Add Old Value

Range: 键入25 through 32 New Value

Value: 键入D OldNew: 点击Add Continue OK

Rrandom值为25~32时,treat值为D

注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。

File→New→Syntax,打开Syntax窗口,键入如下程序: input program.

numeric n k number group (F8.0)/random(F8.6). string treat(A1). compute n=32. compute k=4. loop number=1 to n. end case.

compute n=lag(n). compute k=lag(k). end loop. end file. end input program. compute random=uniform(1). set seed 20071222. rank variables=random .

compute group = trunc((rrandom-1)*k/n ). formats group(F3.0). compute

treat=substr(\.

list number treat.

结果中显示受试对象编号及被分到的处理组

注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。 输出结果

4-16

开始数据录入程序段

受试对象总数为32 4个处理组

结束数据录入程序段

产生范围在0~1之间的伪随机数 设定随机种子为20071222 对伪随机数排序

根据伪随机数的序号进行分组

第四章 定量资料的统计描述

Data View窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)

Output窗口

图3-5 SPSS编程实现受试对象随机分配结果

List

number treat number Treat 1 D 17 C 2 D 18 C 3 B 19 B 4 C 20 C 5 D 21 B 6 D 22 A 7 B 23 C 8 C 24 D 9 D 25 C 10 A 26 A 11 D 27 B 12 B 28 A 13 C 29 A 14 B 30 A 15

A

31

B

4-17

第四章 定量资料的统计描述

16 A 32 D

编程实现随机分配的结果见data view 窗口(图3-5)或output 窗口。可以看出32只大鼠被随机分配到A、B、C、D组。在用此程序进行随机分组前,事先规定A、B、C、D分别对应于对照组、MEL组、TXL组和MEL+TXL组。从分配结果中可以看出:10,15,16,22,26,28,29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL组;4,8,13,17,18,20,23,25号大鼠被分到TXL组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL组。

第四章 定量资料的统计描述

【习题解析】 一、思考题 1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。

2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。 4. 正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数?和形态参数?;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间(??1.96?,??1.96?)内的面积为95.00%;区间(??2.58?,??2.58?)内的面积为99.00%。

5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。 二、案例辨析题

统计描述时,常见错误是对定量资料的描述均采用均数、标准差。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清胆固醇的频数分布图如下:

4-18

第四章 定量资料的统计描述

频数

图4-1 血清甘油三酯(TG)的频数分布

可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:

??集中趋势指标M??X?150??X?150??/2?(1.76?1.75)/2?1.755 (mmol/L)

????1????2????2?离散程度指标 四分位数间距= P75?P25?2.10?1.34?0.76 (mmol/L)

三、最佳选择题

1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D

四、综合分析题 1. 解:输出结果

频数 图4-4 尿总砷的频数分布图

由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。 输出结果

4-19

第四章 定量资料的统计描述

图4-5 尿总砷对数的频数分布图

由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。

(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。 输出结果 Descriptive StatisticsNlgxValid N (listwise)176176Minimum-1.99Maximum-.24Mean-1.1831Std.Deviation.39685 结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得到几何均数

G?0.0656(μg/L)。

2. 解:

(1) 已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。

下限:X?1.96S?4.84?1.96?0.96?2.96(mmol/L)

上限:X?1.96S?4.84?1.96?0.96?6.72(mmol/L)

该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L~6.72mmol/L。

(2) 45~55岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。

Z1?3.25?4.84??1.66

?0.96X??5.25?4.84Z2?2??0.43

?0.96?X1??查标准正态分布曲线下的面积表(附表2)得: ?(Z1)??(?1.66)?0.0485

?(Z2)?1??(?0.43)?1?0.3336?0.6664

D??(Z2)??(Z1)?0.6664?0.0485?0.6179?61.79%

4-20


医学统计学(李晓松主编 第2版 高等教育出版社)附录 思考与练习(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:赤峰学院2011年迎新工作方案

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: