随机变量的数字特征及其应用(3)

2020-02-21 15:04

青岛大学学士学位论文

例：

A和B是两名真实水平都差不太多的射击运动员，但要去参加奥运会只有一个名额，教练员为了取得更好的成绩，只能派出那个相对来说实力最强的运动员，于是他安排两位运动员在同样的条件下进行了一组射击，射击的结果如下表所示，问：A和B哪位运动员实力更强一些？ A运动员的成绩表

A 7 8 9 P 0.2 0.2 0.6 B运动员的成绩表

B 7 8 9 P 0.1 0.7 0.3

我们可以根据上表分别求出A和B两个运动员的射击均值（数学期望），来分析他们水平的差别。

解：E(A)=7 ?0.2+8 ?0.2+9?0.6=8.4(环)

E(B)= 7 ?0.1+8 ?0.7+9?0.3=9(环) 计算结果我们可以看出，E（B）>E（A）

所以要单纯从实力强弱的角度上分析运动员水平的话，就可以选B运动员去参加奥运会。B运动员的数学期望高于A运动员的数学期望，代表着在相同的比赛条件下（可假设为外界对于运动员影响都一样）B 运动员实力要强于A运动员，可以派B运动员去参加比赛其把握更大一些。从以上例子我们可以看出在数学期望对于体育比赛的影响。

我们都知道，概率论与数理统计是从数量上研究随机现象统计规律性的一门学科。且随机变量的分布函数比较能较全面的表现出随机变量的统计规律性。但是在现实很多的经济现象中，要求随机变量的分布函数并不是一件容易的事情，所以只要能知道能反映随机变量的一些重要数字特征就可以。而且另一方面来说，有一些常用的分布，譬如正态分布，泊松分布等等，这些分布只依赖几个参数。所以研究随机变量的数字特征在理论上和实际中都有很重要的意义。数学期望这一数字特征是随机变量的重要的数字特征之一，它也在实际生活中很多地方都扮演着十分重要的作用，本文也仅仅只是在经济决策和体育比赛中的一些简单例子来粗浅的阐明一些数学期望的实际应用，以传达数学期望在实际生活中的现

- 6 -

青岛大学学士学位论文

实意义及其重要性。下面我们来研究随机变量的另一个重要的数字特征——方差。

3方差

通过以上对数学期望的简要分析，我们可以了解到随机变量X的数学期望E(X)是分布的一种位置特征数，它刻画了X的取值总是在E(X)周围波动。但这个位置特征数无法反映出随机变量取值的“波动”大小，比如X与Y的分布列分别为

X -1 0 1

Y -10 0 10

1/3 1/3 1/3

P 1/3 1/3 1/3

3.1方差的引入与定义

从以上X和Y的分布列我们可以得知，尽管它们的数学期望都是0，但显然Y取值的波动要比X取值的波动要大。能否用一个数值来反映出随机变量的“波动”大小，这里数学期望显然是不能反映出这种性质的。如何要用一个数字或者一个数学概念来表示出随机变量“波动”的大小，自然而然的就出现了方差这个非常重要的特征数。

定义：假设随机变量X的数学期望为b=E(X),但是X的取值并不一定正好

是b，会或多或少的有偏差，偏离的量X—b有正有负，为了不让正负偏差彼此抵消，我们考虑（X-b）2,不考虑数学上难以处理的绝对值X?b.由于（X-b）2 仍然是一个随机变量，所以可以取其数学期望E（X-b）2就可以刻画X的“波动”程度，则这个量被称为X的方差，定义为假若随机变量X2的数学期望存在，则称偏差平方（X-EX）2的数学期望E（X-EX）2为随机变量（或相应分布）的方差，记做 Var(X)=E(X-E(X))2=?(xi?E(X))2p(xi)

i这是在离散场合时的方差定义，在连续场合方差的定义为

- 7 -

青岛大学学士学位论文

+?Var(X)=E(X-E(X))=

-?2(x?E(X))p(x)dx ?3.2研究方差的重要性

我们给出一个简单的例子来分析一下研究方差的重要性。

例如有一批零件，可以得知其使用寿命是E（X）=900（小时）。仅仅有这一个

指标我们是不能判定这批零件的质量好坏的。实际上，在这批零件中，有可能绝大部分零件的寿命都在850~950小时之间，也有可能在这批零件中可能有将近一半是高质量的，其使用寿命可能有1000小时，另一半可能是质量很差的，它的寿命可能仅为800小时。现在为了评定这批零件的使用寿命，还需要进一步分析零件寿命X与其数学期望E(X)=900(小时)的偏离程度。假若分析结果其偏离程度较小，表示质量比较稳定。从这个层面上考虑的话，我们就认为这批零件的质量较好。但是，怎么要用一个量去度量这个偏离程度呢？显然，我们前面所分析过的用数学期望的思想去分析就不是很好用了，所以得用到方差这个数字特征来去衡量这个偏离程度。通常用量E((X?E(X))2)表示零件寿命X的方差，这个特征值就可以反映偏离程度。假若此数值越大，则表明偏离程度越大，反之，则说明偏离程度越小。

在讨论数学期望在体育比赛中的应用问题时，曾经引入过一个挑选运动员去参加奥运会的的实例。当时仅仅是在两个运动员实力差不太多的情况下按照实力微弱差距去挑选实力更强的那个运动员，那我们可以试想一下，假如教练员不去考虑两个运动之间微弱的实力差距，而更加注重的是运动员临场的发挥，对于环境的适应能力，尤其是在射击这种对于运动员心里素质要求极高的运动中，更要去考虑运动员发挥的稳定性,这时，数学期望这个数字特征就体现不出这种“稳定性”，而方差就可以。

Var(A)=E(A-E(A))2=?(ai?E(A))2?p(Ai)

22= (a1?E(A))?P(A1)+(a2?E(A))?P(A2) +(a3?E(A))?P(A3)

2i=(7-8.4)2 ?0.2+(8-8.4)2 ?0.2+(9-8.4)2 ?0.6 =0.392+0.032+0.216=0.64

Var(B)=E(B-E(B))2=?(bi?E(B))2?p(Bi)

=(b1?E(B))?P(B1)+(b2?E(B))2?P(B2)+(b3?E(B))2?P(B3) =(7-9)2?0.1+(8-9)2?0.7+(9-9)2 ?0.3 =0.4+0.7+0=1.1

2i由计算结果我们看出，Var(A)

- 8 -

青岛大学学士学位论文

员来说起伏不大，故从稳定性的角度上来选择的话，应选择A运动员。同样一个案例，如果单从实力强弱来说，可能会选择B远动员去参赛，这时用到的是数学期望的应用问题，但如果从运动员发挥的稳定性上来选择，此时又选择A运动员去参加比赛更加稳妥。此时则是用到了方差的应用问题。所以，从不同角度去考虑问题，就会有不同的结果，这说明，研究方差的应用问题和研究数学期望的应用问题一样，也是非常有必要的。下面我们简单研究一下方差在实际生活中的应用问题。

3.3方差的应用问题

方差分析法

在科学研究中，有时为了探索研究某一个分析任务的可靠性和影响因素，就

需要进行多次的试验。比如说，在化学研究中，为了测试试剂的准确化学性质，取几批试剂分别送到几个相关的实验室用各种不同的方法进行试验，每一方法的测定过程又重复多次，最终会得到大量的数据。在分析结果时，我们会考虑到底哪一个因素对测定结果影响最大？哪一个因素对结果影响不是很大？这时有一种方法就可以判断这种结果，这就是方差分析法，它常被用作处理和判断数据的手段，我们下面结合实例来简单分析一下方差分析法的有关知识。

在数理统计这门学科里，我们用常用标准偏差表示精密度，它也被称为标准差或者是均方误差，用?表示，其表达式为

?=?(x??)ii?1n2N （?1）

这个式子是应用于大量数据的前提下（一般有40次以上的测定）。此时，测定的平均值就比较接近与真值，用?表示，根式的分子代表各种测定的数据的偏差的平方和，N是测定的次数。这时方差代表各偏差平方和的平均值，用?2表示。我们知道，只有当测试次数是无限多或者至少有40次以上是，所得的平均值才被称为真值。但是，在通常情况下，测定次数总是有限的，这样的话，所得的平均值就并不是真值。这时，如果用（?1）去计算标准偏差就不合理。测定平均值同真值不相等，测定值与平均值之差同测定值与测定值与真值之差不相等。为要表示有限测定次数的精密度采用符号S代替?，这样有效测定次数标准偏差的计算公式就为：s??(x?x)i2N?1 (?2)

与式子（?1）相比，用试样平均值x代替了真值?，用N?1代替N。N?1

- 9 -

青岛大学学士学位论文

在数理统计中称之为“自由度”，它表明了在N次测定中，只有N?1个可变的偏差。自由度也可以这样理解：数据中可以用来对比的数目。

举一个例子：两次测定x和y，只有一个x和y之间的比较，但是三次测定会有两种比较（也就是其中任何两个数据之间与这两个数据的平均值与第三个数据之间的比较），以此类推，N次测定只有N—1个可以进行对比。如果有几个互

22相独立的因素可以同时影响测定结果，设不同来源的方差分别为?12,?2,根,...,?n据方差的加法法则，总的方差?2应为各个方差的和：

22 ?2??12??2??????n方差分析就是将总的方差分解成为各个方差的成分，然后再利用显著性检验

法进行分析判断和得到适当的结论。最简单的有一种分析的方法：单因素的方差分析方法，就是以上例子中试验者使用多种不同的方法去测定试验结果，每种方法都重复去做几次，然后再判断不同的方法所得的平均值之间是否存在差异。

通过以上对方差的现实应用中的方差分析法的简单研究，我们可以看到，无论是在科学研究中还是在数据统计中，方差的作用都是不言而喻的。通过有方差这一数字特征，又会给随机变量的数据分析带来不一样的角度去分析问题和解决问题。方差分析时我们将总离均差平方和即总变异分析为几个组成部分，其自由度也分解为相应的几部分，故方差分析又称变异数分析。这种分析通常在医学研究中用的会比较多。方差具有对统计数据的稳定性的直观表现的性质，这种特性就决定了它会在生活的方方面面都会被用到。

以上我们是在对一维随机变量在做简单研究，可现实生活中这种简单的例子很少，更多的是二维甚至是多维随机变量的数字特征的应用，这时候它们的方差就出现了一个新的数字特征去衡量，那就是协方差，下面我们重点讨论一下协方差及其应用。

4 协方差及其相关系数

4.1协方差

对于二维随机变量（X，Y），我们不仅要分离讨论X与Y的数学期望和方差之外，更需要讨论描述X和Y之间相互关系的数字特征，描述这种相互关联程度的一个特征数就是协方差。

定义1：设（X,Y）是一个二维随机变量，假如E?(X?E(X))(Y?E(Y))?存在，

则称此数学期望为X与Y的协方差，或称为X与Y的相关（中心）矩，记做：

Cov(X,Y)?E?(X?E(X))(Y?E(Y))?.

特别地，有Cov(X,X)?Var(X).

- 10 -

共5页:

随机变量的数字特征及其应用(3).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档