浅谈正态分布的重要性质
摘 要:正态分布是概率论中最常见、最重要的一个分布,原因有三:一、许多实际问题中的变量都服从或者近似服从正态分布;二、正态分布的密度函数和分布函数具有各种优良性质;三、一些重要分布的极限分布为正态分布。四、一般正态变量都可以变换为标准正态变量,而人们制定了标准正态变量的分布函数值以供查询,这给有关正态分布的计算问题带来了极大的方便。本文就正态分布的这些特点做简要归纳。
关键词:正态分布;正态变量;性质
以下首先介绍正态分布的定义,接着介绍正态变量的数字特征、曲线性质、
取值范围,然后说明一般正态变量与标准正态变量的关系以及多个正态变量的和分布。最后介绍正态分布与其他分布的关系。 1正态分布的定义
如果一个连续型随机变量?的密度函数为 f(x)?12??e?(x??)22?2,
其中?,?(??0)为常数,那么就称?服从正态分布,记作?~N(?,?2).正态分布也叫高斯(Gauss)分布。 2实际问题中的正态变量
在实际问题中,气象学中的温度、湿度、降雨量,有机体的长度、重量,实验中的测量误差、热力学中理想气体分子的速度、经济学中的众多度量等都服从或者近似服从正态分布. 3 正态变量的重要性质 3.1数学期望和方差
若正态变量?~N(?,?2),则E???,D???2.即正态变量的两个参数正是它的期望和方差。 证明 有
1
E???x?????12??e?(x??)22?2dx
令 z?x???1,则
?? E???2??2???(?z??)e?z22?z22dz
???z22=
?????zedz??2????edz
=?
D?=E(??E?)2?
?????(x??)212??e?(x??)22?2dx
令 y?
D?=
x??? ,则有
???2?2???y2e?y22dy??2?2?????yd(?e?y22)
?2 =
2?=
y2y2????????22??ye??edy? ?????????2?2??????ey22dy
=?2
3.2图形性质
正态分布的密度曲线图形呈钟形,关于x??对称,在x??时取最大值
12??.当?不变时,?越大,图形越平、越宽,在?点附近取值的概率越小;?越小,图形越尖、越窄,在?点附近取值的概率越大。当?不变时,?变大,图形往右移,?变小,图形往左移.直观地说,正态变量在?点附近取值概率最大,在远离?点处取值概率很小。
“3?”3.3 法则
若?~N(?,?2),则有
2
P(?????????)??(1)??(?1)?0.6866P(??2??????2?)??(2)??(?2)?0.9544 P(??3??????3?)??(3)??(?3)?0.9974
由此可知,正态变量?落在区间???3?,??3??外的概率不到0.003,这样的事件在数学上被称作小概率事件,在一次试验中被认为是不可能发生的。即正
“3?”态变量几乎一定落在区间???3?,??3??内,这被称为法则.
3.4 可标准化
引理 设随机变量?~N(?,?2),则
(1)??a??b~N(a??b,(a?)2),其中a(a?0),b为常数. (2)?????~N(0,1). ?证明 (1)分别记?的分布函数与密度函数为F?(y)与f?(y), 先设a?0即有
F?(y)?P(??y)?P(a??b?y)?P(?? 若a?0,则有
F?(y)?P(??y)?P(a??b?y)?P(??将以上两式分别关于y求导,得 f?(y)?21y?b11f?()?e??y?(a??b)?/[2(a?)] |a|a|a|2??y?by?b)?F?() aay?by?b)?1?F?() aa故??a??b~N(a??b,(a?)2).
(2)在引理中取a?1/?,b???/?,即得 ?~N(0.1).
由这一引理知,若?~N(?,?2),则它的分布函数F(x)和密度函数f(x)可以分别写成
F(x)?P(??x)?P(???x??x???)??(); ???1x??f(x)?F'(x)??().
??3
对于任意区间[x1,x2]有
P(x1???x2)?P(x1???x??x?????x2???)??(2)??(1) ?????这样利用标准正态分布表N(0.1)就能方便地求出一般正态变量N(?,?2)落在任意区间的概率。 3.5可加性 3.5.1
若?~N(?1,?1),?~N(?2,?2),二者相互独立,则
22?????~N(?1??2,?12??22); 证明 已知?和?的密度函数分别是 f?(x)?12??1?(x??1)22?12e , f?(x)?12??2?(x??2)22?22e
由卷积公式可得?的密度函数为 f?(z)?整理得 f?(z)?12??1?212??1?2?????e??(x??1)2/?12?(z?x??2)2/?22/2?dx
?????e?(ax2?2bx?c)dx
2(z??2)21111?1z??21?1其中a?(2?2), b?(2?) , c?(2?). 222?1?22?12?1?2?2而积分
?????e?(ax2?2bx?c)dx??ae?(ac?b2)/a,
得
f?(z)?12??1??222e??z?(?1??2)?2/2(?12??22)??
因此?????服从N(?1??2,?1??2).
由数学归纳法容易得知对任意有限个正态变量仍具有可加性。即有如下
4
22定理:
3.5.2 若?i~N(?i,?i),i?1,2,??,n.而且它们彼此都相互独立,则
2????i~N(??i,??i2).
i?1i?1i?1nnn3.6 n个独立同分布的随机变量和的中心极限定理
由以上可知任意有限多个相互独立的正态变量的和仍是正态变量,不仅如此,多个非正态变量的和虽不是正态变量,但当个数很多时依然可认为是服从正态分布,因为有如下定理:
3.6.1 林德贝格-勒维(Lindeberg-Levy)定理
若?1,?2,?是一列独立同分布的随机变量,且E?k?a,D?k??2(?2?0),
k?1,2,?,则有
?n?k?na??? limP?k?1?n?????n?????x?????12??x??e?t22dt
证明 设?k?a的特征函数为?(t),则
??k?1nk?na?n的特征函数为
?t?)? ??(??n?n???k?a
k?1?nn又因为E(?k?a)?0,D(?k?a)??2,所以 ??(0)?0,???(0)???2 于是特征函数?(t)有展开式
1t2 ?(t)??(0)???(0)t????(0)?o(t2)=1??2t2?o(t2)
22从而对任意固定的t,有
5
?t?t?t??()?1??o()??e???2nn??n???n22n?t22,n???
而e?t22是N(0,1)的特征函数,由此可知命题成立。
这个定理说明当相互独立且同分布的随机变量个数n无限增大时,不管它们服从什么分布,它们的和的极限分布都是正态分布。
特别的,一个服从二项分布的随机变量可以看成是n个相互独立的服从二点分布的随机变量的和。因此有如下定理:
3.6.2 棣莫弗-拉普拉斯(De Moivre-Laplace)定理
在n重伯努利试验中,事件A在每次试验中出现的概率为p(0?p?1),?n为
n重伯努利试验中事件A出现的次数,则 limP(n???n?npnpq?x)??2?1x??e?t22dt.
这个定理说明二项分布收敛于正态分布。这样当n很大时,可以通过查标准正态分布表来求服从二项分布的随机变量的概率,这比直接计算二项分布的概率优越的多。
此外还可以证明泊松分布也收敛于正态分布。
总之,正态分布自身具有各种重要性质,它与其他分布也有十分重要的联系。另外,实际问题中正态分布应用十分广泛。这些使得正态分布在理论和实践中都有十分重要的意义,而且无疑成为了最重要的分布之一。
参考文献:
[1]魏宗舒等.概率论与数理统计教程.高等教育出版社.2008,4(2) [2]沈恒范.概率论与数理统计教程.高等教育出版社.2011,6(2)
6