医学统计学
2. 比较均数相差悬殊的多组资料的变异度: 某地不同年龄组男子身高的变异程度
年龄组 3-3.5岁 30-35岁
表中可见,虽然30~35岁组的标准差明显大于3~3.5岁组的标准差,但事实上30~35岁组男子身高的变异并不大,而3~3.5岁组男童身高的变异却很大。这种均数相差悬殊的资料比较变异程度时,应当用变异系数说明其变异情况。
小 结
为了解数值变量的分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征(集中趋势和离散趋势),以及分布类型(对称分布和偏态分布)。 一.
平均数是描述频数分布集中位置的指标,它代表一组观察值的平均水平,
人数 100 100
均数±标准差 变异系数(%) 90.1±3.1 170.2±5.0
3.2 0.3
常用平均数的指标下表: 平均数 均数 几何均数 中位数 意义 平均数量水平 平均增(减)倍数 位次居中的观察值水平 应用场合 应用甚广,最适用于对称分布,特别是正态分布 等比级数资料,对数正态分布 偏态分布,分布不明,分布末端无确定值 百分位数描述观察序列在某百分位置的水平,是分布的百分界值,可用于医学参考值范围,适用于任何分布。
二、描述频数分布离散程度的指标有:
1) 极差与四分位间距,后者较稳定,但均不能综合反映各观察值的变异程度; 2) 方差和标准差,最为常用,对正态分布尤为重要;
3) 变异系数常用于:不同测量单位的几组资料变异度的比较;均数相差悬殊
的几组资料变异度的比较。
医学统计学
第四讲 正态分布及其应用
一、 正态分布的概念和特征
根据频数表资料绘制成直方图,可以设想,如果将观察人数逐渐增多,线段不断分细,图中直条将逐渐变窄,其顶端将逐渐接近一条光滑的曲线,这条曲线称为频数曲线或频率曲线,略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布(normal distribution)。由于频率的总和等于100%或1,故横轴上曲线下的面积等于100%或1。
正态分布是一种横重要的连续型分布,在生物统计学中,占有极其重要的地位。许多生物学现象所产生的数据,都服从正态分布。
1、正态分布的图形 有了正态分布的密度函数f(X),即正态分布的方程,就可给出图形
f(x)
?
医学统计学
上式中右側?为均数,?为标准差,X为自变量。当X确定后,就可由此式求得其密度函数f(X),也就是相应的纵坐标的高度。所以,已知?和? , 就能绘出正态曲线的图形。 2、正态分布的特征
(1) 正态分布以?为中心,左右对称。
(2)正态分布有两个参数,即?和?。?是位置参数,当?恒定后,
? 越大,则曲线沿横轴越向右移动;? 越小,则曲线沿横轴越向左移动。?是变异参数,当? 恒定时,?越大,表示数据越分散,曲线越“胖”;?越小,表示数据越分散,曲线越“瘦”。 (3)正态分布的偏斜度 ?1=0,峭度 ?2=0
为了应用方便,常将上式作如下变换,
u?X???
也就是将原点移到 ? 的位置,使横轴尺度以?为单位,使?=0,?=1,则正态分布变换为标准正态分布。(standard normal distribution) ,u称为标准正态离差(standard normal deviate) 标准正态分布的密度函数为:
?(u)?1e2??u22
一般用N(?,?2)表示均方为?,方差为?2的正态分布。于是标准正态分布用N(0,1)表示。
医学统计学
标准正态分布有以下特征:
(1) 在u=0时,?(u)达到最大值。
(2) 当u无论向哪个方向远离0时,?(u)的值都减小。 (3) 曲线关于Y轴对称,即?(u)=?(-u)。 (4) 曲线和横轴所夹的面积等于1。
二、标准正态曲线下面积的计算 P(u1 < ?U ?< u2) =?(u2) ? ?(u1) 举例
已知高梁品种“三尺三”的株高服从正态分布N(156.2,4.822),求:(1)X<161cm 的概率;(2)X>161cm 的概率;(3)X在152~162cm 间的概率。 (1) 依题意:
161?156.2P(X?161)??()??(1)?0.841344.82
所以,“三尺三”的株高低于161cm的概率为0.84134。
(2) 依题意得:
164?156.2P(X?164)??()?1??(1.62)?1?0.94738?0.052624.82
(3)依题意得:
162?156.2152?156.2)P(152?X?162)??()??(??(1.2)??(?0.87)?0.88493?0.19215?0.692784.824.82
医学统计学
下列一些值很重要,应予记忆:
u= -1 到 u=1 面积=0.6827 u= -1.96 到 u=1.96 面积=0.9500 u= -2.58 到 u=2.58 面积=0.9900 三、小结
1、正态分布是一种连续性的分布,不少医学现象服从正态分布或近似正态分布(如同性别、同年龄儿童的身高,同性别健康成人的红细胞数、血红蛋白量、脉搏数等,以及实验中的随机误差等);或经变量变换转换为正态分布(如某些病人的潜伏期以及医院病人住院天数等),可按正态分布规律来处理,它也是许多统计方法的理论基础。
2、正态分布的特征是:
(1)曲线在横轴上方,均数处最高; (2)以均数为中心,左右对称;
(3)确定正态分布的两个参数是均数?和标准差?。
正态分布用N(?,?2)表示,为了应用的方便,常对变量x作u = (x-?)/? 使 ?=0,?=1,则正态分布转换为标准正态分布用N(0,1)表示。
3、运用正态曲线下面积的分布规律,可计算医学参考值范围和质量控制等。