定理:设二维随机变量(X,Y)的相关系数为?(X,Y),则 (1)、0??(X,Y)?1; (2)、在(X,Y)服从二元正态分布的条件下,X与Y独立的充要条件是?(X,Y)?0; (3)、若?(X,Y)?1,则几乎必然有Y?aX?b,其中a?0,a,b是确定的常数; 若?(X,Y)??1,则几乎必然有Y?aX?b,其中a?0,a,b是确定的常数。
目录 Back Next
3、 条件分布
在已知其中某些随机变量的取值的情况下,可以进一步 确定其他随机变量的条件分布。例如,
P{Xi?xi|xj?Xj?xj??x}?FXi,Xj(xi,xj??x)?FXi,Xj(xi,xj)FXj(xj??x)?FXj(xj).
在有密度函数的情况下,我们还可以求条件密度函数,甚至利用Bayes定理,解决许多重要问题。
目录 Back Next
综上所述,我们知道在概率论里学过许多分布,当然,还有许多分布我们没有学过。但是,在实践中我们可能会遇到各种各样的分布,甚至还有没被发现的分布。在处理数
据的时候,我们要搞清楚:
1、 数据是哪个或哪些指标的取值?
2、 这个或这些指标是不是随机变量或随机向量? 3、 如果是,那么它服从什么分布? 4、 用统计方法确定分布;
5、
分布确定后,用概率方法求出问题的解。
下面我们就讨论用统计方法确定分布的问题。
目录 Back Next
经验分布函数和频率直方图
当我们确定讨论的指标的确是随机变量后,剩下的关键任务就是确定它的分布。那么它的观测数据就是我们赖以解决问题的基本资料,叫做样本,而这个随机变量就叫做总
体。这些数据反映了该随机变量分布的基本特征。我们可
以利用这些数据构造一个分布函数,理论上可以证明它很接近于那个未知分布。这个分布函数就叫做经验分布函数。
目录 Back Next
例6、例2续(经验分布函数)
在例2,我们确定所讨论的指标—在时间间隔ΔT秒内放射出的α粒子数X,是一个随机变量。且有该随机变量的n=2608个观测值,这就是一个容量为2608的样本。在没有其他信息的情况下,首先应该给出该样本的经验分布函数:
样本中不超过??x??的观测值的个数Fn(x)?,???x?R.
n在这里我们可求出这个经验分布函数如下:
?0, x?0;?0.021855828, 0?x?1;??0.099693252, 1?x?2;??0.24654908 , 2?x?3;?0.447852761, 3?x?4;??0.651840491, 4?x?5;F2608(x)???0.808282209, 5?x?6;?0.912960123, 6?x?7;??0.966257669, 7?x?8;?0.98351227, 8?x?9;??0.993865031, 9?x?10;?1, x?10.?
目录 Back Next
粒子数X 频数n 0 57 1 203 2 383 3 525 4 532 5 408 6 273 7 139 8 45 9 27 ?10 16 0.077837 0.146856 0.201304 0.203988 0.156442 0.104678 0.053298 0.017255 0.010353 0.006135 频率f 0.021856 0.080722 0.156197 0.201494 0.194945 0.150888 0.097323 0.053805 0.026028 0.011192 0.006547 概率p 0.020858