第四章 常用概率分布
一、二项分布的特征
①二项分布图的高峰在μ=nπ处或附近;
②π为0.5时,图形是对称的;当π不等于0.5时,分布不对称 ③当对同一n,π离0.5愈远,对称性愈差 ④对同一π,随着n的增大,分布趋于对称
⑤当n→∞时,只要π不太靠近0或1,特别是当nπ与n(1-π)均大于5时,二项分布趋于对称。
⑥当n→∞时,且π→0时,二项分布近似Poisson分布
二、二项分布的应用条件是什么? ①实验总次数n一定
②每次试验只有两个可能结果且相互独立,不予考虑“可疑”等模糊结果,属于二分类资料 ③每次试验只出现一个结果并且是两个可能结果中的一个结果
④已知发生某结果与概率为π且不变,则其对立结果的概率为(1-π) ⑤n次试验在相同条件下进行且各次试验结果相互独立
三、Possion分布的特征?
①Possion分布的总体均数与总体方差相等,均为λ
②当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布 ③Poisson分布的观察结果具有可加性
四、正态分布的定义
若连续性随机变量X的概率密度函数为:
f(x)?
2
其中μ为均值,σ为标准差,则随机变量X服从正态分布,记为X~N(μ,σ )相应的分布函数(概率密度的累积函数)为:
1e2??(x??)2?2?2F(x)?
12???x??e?(x??)22?2dx
五、正态曲线的性质
①曲线在x轴的上方,与x轴的上方,与x轴不相交 ②曲线是单峰的,它关于直线x=μ对称 ③曲线在x=μ处达到峰值(最高点),在x=μ?σ处有拐点 ④曲线与横轴x所夹面积为1
⑤均值μ反应随机变量的平均水平(位置参数),向右平移表示逐渐增大,向左平移表示逐渐减少。
⑥标准差σ反映随机变量的集中趋势(形状参数),σ越大曲线越“矮胖”,表示分布越分散;
σ越小曲线越“瘦高”,表示分布越集中。
当n很大,π很小时,nπ=λ为一常数时,二项分布近似于Poisson分布P(nπ)
当n较大时,π不接近0也不接近m时,二项分布近似于正态分布,N(nπ,nπ(1-π)) 当λ≥20时,Poisson分布渐近正态分布N(λ,λ)
六、简述二项分布、Possion分布、正态分布的区别与联系
区别:二项分布、Possion分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。 联系:Possion分布可以视为n很大而π很小的二项分布。当n很大而π和1-π都不是很小的时候二项分布渐近正态分布,当λ≥20的时候,Possion分布渐近正态分布。
七、对于一组近似正态分布的资料,除样本含量n外,还可计算 X ,S和 X?1.96X ,问各说明什么?
①X为算数均数,说明正态分布或近似正态分布资料的集中趋势 ②S为标准差,说明正态分布或近似分布资料的离散趋势
③ X ?1.96X 可估计正态指标的95%医学参考值范围,即此范围在理论上应包含总体的95%的个体值。
八、正态分布、标准正态分布与对数正态分布有何异同 1、相同点:
① 随机变量的类型相同
服从这种分布的随机变量都是连续型随机变量 ② 可转化性
对数正态分布变量记对数变换后可转化为正态分布变量 正态分布变量经标准化变换后可转化为标准正态分布 2、不同点: ① 表示不同
2
正态分布记为N(μ, σ ),是曲线族
标准正态分布是一种特殊的正态分布(均数为0,标准差为1),记为N(0,1)
对数正态分布记为N(μlgX,,σ lgX
2
),为另一曲线族
② 概率密度函数曲线不同
正态曲线、标准正态曲线均呈对称性 对数正态曲线呈非对称性,为右偏态 ③ 应用不同
正态分布和标准正态分布应用广泛,其资料可直接用于统计分析 服从对数正态分布的资料一般先记对数变换后,再进行统计处理
九、控制图的基本原理
如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布;依据标准正态分布曲线下面积的分布规律性,确定出现概率非常小的若干情况作为异常标准如果
出现相应结果则判为异常。
十、质量控制
判断异常点的8种情况: 1. 某点位于控制线3S之外
2. 在中心线的一侧连续有9个点 3. 连续6个点稳定地减少或增加 4. 连续14个点交替上下
5. 连续3个点中有2个点位于2S之外 6. 连续5个点中有4个点位于1S之外
7. 在中心线一侧或两侧连续15个点位于1S之内 8. 在中心线一侧或两侧连续8个点位于1S之外
十一、医学参考值范围(reference range) (一) 定义
是指包括绝大多数“正常人”的各种生理及生化指标常数,由于存在个体差异,生物医学数据并不是常数,而在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”
(二) 制定方法
正态分布法、百分位数法
(三) 确定原则
① 选定足够多例的同质正常人作为研究对象,所谓“正常人”并不是指任何器官、组
织的形态与功能都健全的人,而是指所有可能影响研究指标(确定参考值范围的指标)的因素观察值均处于正常范围内,从可行的角度考虑,可以说:原则上应是体检合格者(健康人)并且所有已知对研究指标有影响的因素观察值均处于正常范围内;对于某些指标为不正常或患某种疾病的对象,如果有充分的证据表明这些不正常指标或所患疾病不会对研究指标有任何影响,则这些对象仍可以作为制定这个参考值范围的研究对象 ② 控制检测误差
③ 如果有明显的指标(如年龄、性别)影响同质性,则应考虑进行分组分别建立参考
值范围
④ 根据专业知识正确选择单、双侧参考值范围
⑤ 根据假阳性和假阴性与危险程度合理选择百分界值 ⑥ 必要时,除计算参考值范围外,也给出可疑范围 (四) 确定方法
参考值范围是根据正常人的数据估计绝大多数的正常人所在范围。这一范围与确定根据数据分布与特点选择相应的估计方法 ① 正态分布法:
对于正态分布以及近似正态分布资料,公式如下:
双侧:X
单侧: ② 百分位数法
当资料不服从正态分布,则利用百分位数法估计参考值范围
例如,确定95%参考值范围,相应的百分界值为: 双侧:P2.5~P97.5
单侧:低侧≥P5;高侧≤P95 ③ 对数正态分布法
如果对资料取对数后y=ln(x)呈近似正态分布
此时以y值按正态分布法算出参考值范围,再对其求反对数
(五) 制定参考值范围与一般步骤:
① 定义“正常人”,不同的指标“正常人”的定义也不同 ② 选定足够数量的正常人作为研究对象 ③ 用统一和准确的方法测定相应的指标
④ 根据不同的用途选定适当的百分位数,常用95%
⑤ 根据此指标与实际含义,决定用单侧范围还是双侧范围
⑥ 根据此指标与分布决定计算方法,常用于计算方法:正态分布法、百分位数法
第五章 参数估计
一、什么是抽样误差?抽样误差如何减少抽样误差?样本均数与抽样分布特点? (一)抽样误差
是指从一个总体中随机抽取一个或多个样本,所得的样本统计量与相应的总体参数之间的差异,或者各个样本统计之间的差异称为抽样误差 (二)可以通过增加样本量来减少抽样误差 (三)样本均数抽样分布的特点
① 样本均数恰好等于总体均数是极其罕见的 ② 样本均数之间存在差异
③ 样本均数围绕总体均数,中间多两边少,左右基本对称,呈近似正态分布 ④ 样本均数之间变异明显小于原始变量值之间的变异
二、总体分布形态和样本含量对样本均数的抽样分布会产生何种影响?
①在服从正态分布的总体中进行随机抽样,样本均数的分布服从近似正态分布 ②在不服从正态分布的总体中进行随机抽样,当样本量较小时,样本均数的分布呈非正态分布,当样本量足够大时(如n≥30),样本均数的分布近似服从正态分布
三、标准差S与标准误Sx之间的区别和联系(样本) 区别:
(1)意义:S描述一组变量值的离散程度,并可以作为总体标准差的点估计;Sx描述样本均数间的离散程度,并且是样本均数标准误的点估计
(2)应用:S①标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好② 估计变量值的分布1-α范围;Sx①标准误越小,说明样本均数和总体均数差异越小,用样本均属估计总体均数的可靠性越大②用 估计总体均数的1-α置信区间 (3)与n的关系:n越大,样本标准差S越稳定;n越大,标准误Sx越小 联系:
①都是描述变异程度的统计指标 ②
③n一定时,同一组资料,S越大,Sx越大
控制方法:(S)个体差异或自然差异,不能通过统计方法来控制,(SX)增加样本量可减少 标准误
三、t分布特征
①t分布为一簇单峰分布曲线,V不同,曲线形状不同 ②t分布以0为中心,左右对称
③t分布与V有关,V越小,t值越分散,t分布的峰部越低,两侧尾部翘得越高
④ 当 ,随着V逐渐增大,t分布逐渐接近标准正态分布;当V
趋向∞时,t分布趋近标准正态分布
四、t分布曲线面积与模糊t值间关系
① t界值表中一侧尾部面积称为单侧概率(α) ② 在相同自由度时|t|值增大,α减小 ③ 相同α时,单尾α比双尾α对应的值小 18.评价可信区间估计的优劣
①准确度:可信度α,即区间包含总体参数的理论概率大小,愈接近1愈好 ②精确度:区间的宽度,区间愈窄愈好 ③样本含量为定值时,上述两者相互矛盾 ④ 若只顾提高可信度,则可信区间会变宽
五、标准正态分布(μ分布)和t分布有何不同?
①t分布为抽样分布,标准正态分布(μ分布)为理论分布 ②t分布比标准正态分布的峰值低且尾部翘的高
③随着自由度的增大,t分布逐渐趋于标准正态分布,即当自由度 →∞时,t分布就会完全成为标准正态分布
六、均数的可信区间与参考值范围有何不同?