04 常用概率分布(3)

2019-02-15 21:50

表4—2 126头基础母羊体重在x±kS 区间内所包括的次数与频率

区间内所包含的次数与频率次数频率（%） 84 67.46 119 94.44 126 100.00 119 94.44 126 100.00

x±kS x±1S

x±2S x±3S x±1.96S x±2.58S

数值 52.26±5.10 52.26±10.20 52.26±15.30 52.26±10.00 52.26±13.16

区间 47.16―57.36 42.06―62.46 36.96―67.56 42.26―62.26 39.10―65.42

由表4—2可见，实际频率与理论概率相当接近，说明126头基础母羊体重资料的频率分布接近正态分布，从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。生物统计中，不仅注意随机变量x落在平均数加减不同倍数标准差区间(μ-kσ,μ+kσ)之内的概率而且也很关心x落在此区间之外的概率。我们把随机变量x落在平均数μ加减不同倍数标准差σ区间之外的概率称为双侧概率(两尾概率)，记作α。对应于双侧概率可以求得随机变量x小于μ-kσ或大于μ+kσ的概率，称为单侧概率(一尾概率),记作α／2。例如，x落在(μ-1.96σ,μ+1.96σ)之外的双侧概率为0.05，而单侧概率为0.025。即

P(x＜μ-1.96σ)= P(x＞μ+1.96σ)=0.025

双侧概率或单侧概率如图4—8所示。x落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为0.01，而单侧概率

P(x＜μ-2.58σ)= P(x＞μ+2.58σ)=0.005

图4—8 双侧概率与单侧概率附表2给出了满足P (｜u｜＞u?)=α的双侧分位u?的数值。因此，只要已知双侧概率α的值，由附表2就可直接查出对应的双侧分位数u?，查法与附表1相同。例如，已知u～N(0,1)试求：

(1) P(u＜-u?)+P(u≥u?)=0.10的u? (2) P(-u?≤u＜u?﹚=0.86的u?

因为附表2中的α值是：

??1?所以

12???uu??1?u2e2du

（1) P(u＜-u?)+ P(u≥u?)=1- P(-u?≤u＜u?﹚=0.10=α 由附表2查得：u0.10 =1.644854

(2) P (-u?≤u＜u?)=0.86 ，α=1- P (-u?≤u＜u?)=1-0.86=0.14

由附表2查得：u0.14=1.475791

对于x～N(μ,σ)，只要将其转换为u～N(0,1),即可求得相应的双侧分位数。

1.33)，【例4.8】已知猪血红蛋白含量x服从正态分布N(12.86，若P(x＜l1) =0.03,

P(x≥l2)=0.03,求l1,l2。

由题意可知，α／2=0.03,α=0.06 又因为

x?12.86l1?12.86P(x?l1)?P(?)?P(u??u?)?0.03

1.331.33P(x≥l2)=P(2x?12.86l2?12.86?)?P(u?u?)?0.03

1.331.33故 P(x＜l1＝+ P(x≥l2)= P(u＜-u?＝+ P(u≥u?) =1- P(-u?≤P＜u?)=0.06=α 由附表2查得：u0.06=1.880794,所以

(l1-12.86)/1.33=-1.880794， (l2-12.86)/1.33=1.880794 即 l1≈10.36， l2≈15.36。

第四节二项分布

一、贝努利试验及其概率公式

将某随机试验重复进行n次，若各次试验结果互不影响，即每次试验结果出现的概率都不依赖于其它各次试验的结果，则称这n次试验是独立的。

对于n次独立的试验，如果每次试验结果出现且只出现对立事件A与A之一，在每次试验中出现A的概率是常数p(0

在生物学研究中，我们经常碰到的一类离散型随机变量，如入孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等，可用贝努利试验来概括。

在n重贝努利试验中，事件A可能发生0，1，2，?，n次，现在我们来求事件A 恰好发生k(0≤k≤n)次的概率Pn(k)。

先取n=4，k=2来讨论。在4次试验中，事件A发生2次的方式有以下C4种： A1A2A3A4 A1A2A3A4 A1A2A3A4 A1A2A3A4 A1A2A3A4 A1A2A3A4

其中Ak(k=1,2,3,4)表示事件A在第k次试验发生；Ak(k=1,2,3,4)表示事件A在第k次试验不发生。由于试验是独立的，按概率的乘法法则，于是有 P(A1A2A3A4)=P(A1A2A3A4)=?= P(A1A2A3A4)

= P(A1)·P(A2)·P(A3)·P(A4)=pq试验中，事件A恰好发生2次的概率为

2P4(2)= P(A1A2A3A4)+P(A1A2A3A4)+?+ P(A1A2A3A4)=C4p2q4?2

24?22

又由于以上各种方式中，任何二种方式都是互不相容的，按概率的加法法则，在4 次

一般，在n重贝努利试验中，事件A恰好发生k(0≤k≤n)次的概率为

kPn(k)=Cnpkqn?k k=0,1,2?，n (4-14)

若把(4-14)式与二项展开式

k(q?p)??Cnpkqn?knk?0n

相比较就可以发现，在n重贝努利试验中，事件A发生k次的概率恰好等于(q?p)n 展开式中的第k+1项，所以也把(4-14)式称作二项概率公式。

二、二项分布的意义及性质

二项分布定义如下：

设随机变量x所有可能取的值为零和正整数：0,1,2,?，n，且有

kPn(k)=Cnpkqn?k k=0,1,2?，n

其中p＞0，q＞0，p+q=1，则称随机变量x服从参数为n和p的二项分布 (binomial distribution),记为 x～B(n,p)。

显然，二项分布是一种离散型随机变量的概率分布。参数n称为离散参数，只能取正整数；p是连续参数，它能取0与1之间的任何数值(q由p确定，故不是另一个独立参数)。容易验证，二项分布具有概率分布的一切性质，即： 1、P(x=k)= Pn(k) ?0 (k=0,1,…，n) 2、二项分布的概率之和等于1，即

kpkqn?k?Cnk?0n?(q?p)n?1

kpkqn?k?Cnk?0m3、P(x?m)?Pn(k?m)? (4-15)

4、P(x?m)?Pn(k?m)?k?mkkn?kCpq (4-16) ?nn 5、P(m1?x?m2)?pn(m1?k?m2)? 二项分布由n和p两个参数决定：

k?m1?Cnkpkqn?km2（m1

1、当p值较小且n不大时，分布是偏倚的。但随着n的增大，分布逐渐趋于对称，如图4—9 所示；

2、当p值趋于0.5时，分布趋于对称，如图4—10所示；

3、对于固定的n及p，当k增加时，Pn(k)先随之增加并达到其极大值，以后又下降。

此外，在n较大，np、nq较接近时，二项分布接近于正态分布；当n→∞时，二项分布的极限分布是正态分布。

三、二项分布的概率计算及应用条件

【例4.9】纯种白猪与纯种黑猪杂交，根据孟德尔遗传理论，子二代中白猪与黑猪的比率为3∶1。求窝产仔10头，有7头白猪的概率。

根据题意，n=10，p=3／4=0.75，q=1／4=0.25。设10头仔猪中白色的为x头，则x为服从二项分布B(10，0.75)的随机变量。于是窝产10头仔猪中有7头是白色的概率为：

7P(x?7)?C100.7570.253?10!?0.757?0.253?0.2503 7!3! 【例4.10】设在家畜中感染某种疾病的概率为20％，现有两种疫苗，用疫苗A 注射了15头家畜后无一感染，用疫苗B注射15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能，问：应该如何评价这两种疫苗?

假设疫苗A完全无效，那么注射后的家畜感染的概率仍为20％，则15 头家畜中染病头数x=0的概率为

0p(x?0)?C150.2000.8015?0.0352

同理，如果疫苗B完全无效，则15头家畜中最多有1头感染的概率为

01p(x?1)?C150.200.815?C150.210.814?0.1671

由计算可知，注射A疫苗无效的概率为0.0352，比B疫苗无效的概率0.1671小得多。因此，可以认为A疫苗是有效的，但不能认为B疫苗也是有效的。

【例4.11】仔猪黄痢病在常规治疗下死亡率为20％，求5 头病猪治疗后死亡头数各可能值相应的概率。

设5头病猪中死亡头数为x，则x服从二项分布B(5,0.2)，其所有可能取值为0，1，?，5,按(4-6)式计算概率用分布列表示如下：

0 1 2 3 4 5

0.3277 0.4096 0.2048 0.0512 0.0064 0.0003 从上面各例可看出二项分布的应用条件有三：（1）各观察单位只具有互相对立的一种结果，如阳性或阴性，生存或死亡等，属于二项分类资料；（2）已知发生某一结果(如死亡) 的概率为p，其对立结果的概率则为1-P=q，实际中要求p 是从大量观察中获得的比较稳定的数值；（3）n个观察单位的观察结果互相独立，即每个观察单位的观察结果不会影响到其它观察单位的观察结果。

四、二项分布的平均数与标准差

前面已经指出二项分布由两个参数n和p决定。统计学证明，服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系：当试验结果以事件A发生次数k表示时

μ=np (4-18) σ=npq (4-19) 【例4.12】求【例4.11】平均死亡猪数及死亡数的标准差。以p=0.2,n=5代入 (4-18)和(4-19) 式得平均死亡猪数 μ=5×0.20=1.0(头)

标准差 σ=npq= 5?0.2?0.8=0.894(头)

当试验结果以事件A发生的频率k／n表示时

?p?p (4-20)

?p=(pq)/n (4-21)

?来估计。此时(4-21) ?p也称为总体百分数标准误，当p未知时，常以样本百分数p式

改写为：

??1?p? (4-22) ?q?)/n qSp =(pSp称为样本百分数标准误。

第五节波松分布

波松分布是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。要观察到这类事件，样本含量n必须很大。在生物、医学研究中，服从波松分布的随机变量是常见的。如，一定畜群中某种患病率很低的非传染性疾病患病数或死亡数，畜群中遗传的畸形怪胎数，每升饮水中大肠杆菌数，计数器小方格中血球数，单位空间中某些野生动物或昆虫数，医院门诊单位时间内就诊患者数等，都是服从波松分布的。

一、波松分布的意义

若随机变量x(x=k)只取零和正整数值0，1，2，?，且其概率分布为

k!其中λ＞0；e=2.7182?是自然对数的底数，则称x服从参数为λ的波松分布(Poisson's

distribution)，记为x～P(λ)。

波松分布作为一种离散型随机变量的概率分布有一个重要的特征，这就是它的平均数和方差相等，都等于常数λ，即μ=σ=λ。利用这一特征，可以初步判断一个离散型随机变量是否服从波松分布。

【例4.13】调查某种猪场闭锁育种群仔猪畸形数，共记录200窝，畸形仔猪数的分布情况如表4-3所示。试判断畸形仔猪数是否服从波松分布。

P(x?k)??ke?? ，k=0，1，?? (4-23)

共5页:

04 常用概率分布(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档