医学统计学
们是确定性的,不是随机事件,但可把他们看成随机事件的特例。
统计分析中的很多结论都是带有概率性的。习惯上将 P≤0.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。 《医学统计学》的学习重点是:
1、掌握其基本知识、基本技能、基本概念、基本方法。 建立逻辑思维方法和提高分析问题的能力。 2、掌握调查设计和试验设计的基本原则。
培养收集、整理、分析统计资料的系统工作能力。 3、掌握一套统计软件的使用方法(SAS、SPSS、STATA等)。 能够达到在完成《医学统计学》课程后,独立完成科研论
文和正确应用统计方法。
医学统计学
第二讲 集中趋势
举例
设有A、B两名新战士,他们的射击技术可用下面的分布来表示: 战 士 A 战 士 B 击中环数 8 9 10 击中环数 8 9 10 对应概率 0.3 0.1 0.6 对应概率 0.2 0.5 0.3 问哪一个战士射击技术较好?1、频数分布表 1)、频数表的编制
相同观察结果出现的次数称为频数。将所有观察结果的频数按一定顺序排列在一起便是频数表(frequency table)。 步骤:
① 找出最大和最小值,计算极差 R=Xmax―Xmin ② 根据斯梯阶公式确定组距
H?R1?3.322logn
③ 扫描样本值,划记后获得频数
2)、频数表的用途
① 大样本数据(不限于计量资料)常用的表达方式。
② 便于观察数据的分布类型。
③ 便于发现资料中远离群体的某些特大或特小的可疑值,必要时经检验后舍去。
④ 当样本含量足够大时,各组段的分布频率作为分布概率的估计值。
例7. 我国某地农村1995年已婚育龄妇女现有子女数的分布 子女数 (1) 0 1 2 3 4 5 6 7 8 9 ≥10 合计
妇女数f (2) 13751 25191 30426 28560 21719 13695 7255 3268 151 373 156 145525 频率(%) (3) 9.45 17.30 20.91 19.62 14.92 9.41 4.98 2.25 0.10 0.26 0.11 100.00 累计频数 (4) 13751 38922 69348 97908 119627 133322 140577 143845 144996 145369 145525 —— 累计频率(%) (5) 9.45 26.75 47.65 67.28 82.20 91.61 96.60 98.85 99.64 99.89 100.00 —— 医学统计学
2、集中位置的描述
平均数(average)是统计中最广泛、最重要的一个指标体系。用来描述一组变量的集中趋势、中心位置或平均水平,常作为一组资料的代表值,使资料产生简明概括的印象,又便于组间的比较。常用平均数有均数、几何均数和中位数。 (一)、均数(mean)的计算
x?x2?x3...?xnx?1 ?n① 直接法
?xin
例1、10名7岁男童体重(kg)分别为17.3, 18.0, 19.4, 20.6, 21.2, 21.8, 22.5, 23.2,
24.0, 25.5.求平均体重。
x=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)
② 频数表法:
x?f1x1?f2X2?f3 x3?....?fkxk? ??fxf?f
例2:某地随机检查了140名成年男性红细胞数(1012/L)
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88 5.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50 5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 5.51 5.24 4.98 4.33 4.83 4.56 5.44 4.79 4.91 4.26 4.38 4.87 4.99 5.60 4.46 4.95 5.07 4.80 5.30 4.65 4.77 4.50 5.37 5.49 5.22 4.58 5.07 4.81 4.54 3.82 4.01 4.89 4.62 5.12 4.85 4.59 5.08 4.82 4.93 5.05 4.40 4.14 5.01 4.37 5.24 4.60 4.71 4.82 4.94 5.05 4.79 4.52 4.64 4.37 4.87 4.60 4.72 4.83 5.33 4.68 4.80 4.15 4.65 4.76 4.88 4.61 3.97 4.08 4.58 4.31 4.05 4.16 5.04 5.15 4.50 4.62 4.73 4.47 4.58 4.70 4.81 4.55 4.28 4.78 4.51 4.63 4.36 4.48 4.59 5.09 5.20 5.32 5.05 4.41 4.52 4.64 4.75 4.49 4.22 4.71 5.21 4.94 4.68 5.17 4.91 5.02 4.76
医学统计学
红细胞数(1012/L) (1) 3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~
合计 频数 f (2)
2 6 11 25 32 27 17 13 4
2 1
140(∑f)
组中值 X (3)
3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90
Fx (4)=(2)*(3) 7.8
24.6 47.3 112.5 150.4 132.3 86.7 68.9 22.0 11.4 5.9
669.8(∑fX)
fx?f2X2?f3 x3?....?fkxkx?11 ?f?
= 4.78(1012/L)
均数的两个重要特征:
① 各离均差的总和等于零
?fx ?f
?(x-x)?0
证明:
?(xi?x)??xi?nx??xi??xi?0
??② 各离均差的平方和小于各观察值X与任何数a之差的平方
?(x-x)? ?(x-a)22
均数的应用:
1. 用来描述一组变量值的平均水平,具有代表性,因此变量值必须是同质的。 2. 适用于呈正态分布(对称分布)的资料。
医学统计学
(2)几何均数(geometric mean)的计算 1) 直接法
G?nx1?x2?x3???xnlgxlgx1?lgx2????lgxn)?lg?1(?)nn
例3:5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,求平均滴度。
G?lg?1(G?n2?4?8?16?32
LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903
G=lg-10.903=8 故平均滴度为1:8。
2) 频数表法
G?lg?1(?
例4:40名麻疹疫苗接种麻疹疫苗后一个月,血凝抑制抗体滴度见下表,求平均滴度。 抗体滴度 人数 f 滴度倒数X LgX f*lgX (1) (2) (3) (4) (5)=(2)*(4) 1:4 1 4 0.6021 0.6021 1:8 5 8 0.9031 4.5155 1:16 6 16 1.2041 7.2246 1:32 2 32 1.5051 3.0102 1:64 7 64 1.8062 12.6434 1:128 10 128 2.1072 21.0720 1:256 4 256 2.4082 9.6328 1:512 5 512 2.7093 13.5465 40 72.2471 LgG=(?flgX/?f)=72.2471/40=1.8062 G=lg-11.8062=64 血凝抑制抗体滴度的平均滴度为1:64
几何均数的应用: 用于等比级数资料和对数正态分布资料,
如:某些传染病的潜伏期、抗体滴度、细菌计数等。
flgx)?f