统计量及分布
教程
一、复习
1:统计量定义:总体X,样本?X1,...,Xn?的不含其他未知量的函数g?X1,...,Xn?称为统计量,当样本?X1,...,Xn?观察值?x1,...,xn?给定,统计量的值也可以马上得到g?x1,...,xn?
2:经验分布,总体X~F?x?,样本?X1,...,Xn?观察值?x1,...,xn?,构造离散随机
1*?xi??,i?1,...,n,由格列纹科定理,PmaxFn*?x??F?x??0?1。变量P?Xn
x?Rn说明,经验分布和总体分布很近似。
××××××××××× syms x t pi
int(1/sqrt(2*pi)*exp(-t^2/2),t,-inf,x) ans =
1/2+1/2*erf(1/2*2^(1/2)*x)
A=normrnd(0,1,1,300); X=-4:0.25:4; for i=1:size(X,2)
N(i)=1/2+1/2*erf(1/2*2^(1/2)*X(i)); F(i)=sum(A<=X(i))/300; end
plot(X,N,'r') hold on
plot(X,F,'b*')
??10.90.80.70.60.50.40.30.20.10-4-3-2-101234频数直方图
概率函数的概念:连续随机变量的概率函数指概率密度函数,离散随机变量的概率函数则指概率分布列函数 B=randn(2000,1); hist(B,30)
200180160140120100806040200-4-3-2-101234
3、随机变量的矩(moment)
EXm和E?X?EX?分别称为随机变量X的m阶原点矩和k阶中心矩
k随机变量的一阶原点矩和二阶中心矩分别是()和()?
*二:由格列纹科定理,经验随机变量Xn的概率分布函数Fn*?x?既然和总体的概
率分布函数近似,那么,它们对应的原点矩(中心矩)也应该比较接近。
*?因此,若总体均值EX??是未知量,我们可以用EXn1 ?x1?...?xn?来估计它。
n从统计方案角度,我们就是在用计量
1?X1?...?Xn?的观察值来估计总体均值?。统n1?X1?...?Xn?称为样本均值。 n1n同样道理,我们定义样本方差为统计量?Xi?Xnni?1??2(样本标准差S) :?S2。
11nmm三:一般地,定义?X1?...?Xn?为样本m阶原点矩,?Xi?Xnnni?1??k为样本k
阶中心矩。它们的本质是统计量(从统计方案角度给出的定义),是随机变量。 例题:假若总体N?1,0.52? (只能是假定), matlab模拟生成样本(X1,...,X100)观察值:
2A=normrnd(1,0.5,1,100); %总体N?1,0.5?,模拟生成1行100列对应样
本%(X1,...,X100)观察值?x1,...,x100?
0.990440509876667 0.456830059728371 1.14607416450737 1.42211417308743 1.13117369988854 1.18804293368963 0.776772526380848 1.31710839057461 0.716151537348228 1.15753063975490 1.37796274255211 0.556847783129804 1.48650530076010 0.818573651304815 1.30626706228018 2.69664232460502 0.519594479867830 2.21905864536909 1.04102825387573 0.937016297267826 1.31128141951067 1.51179120263518 0.335323991664327 1.08143288571027 1.25042855414654 0.736522143379910 0.734098153517505 0.744813343920264 1.34384432486879 0.376739338466425 0.945642079797383 1.36490838908572 0.940128811279780 1.30769543134935 0.446256863877806 0.996350641313282 1.58851508910712 0.419899449562763 -0.128878880320553 0.651655748728360 0.650123421214597 1.20762369041690 0.729488855730782 1.05150024750035 0.00682097523570757 1.67886944886903 0.937309291245520 0.656148641881599 0.254887568623161 0.912785231772804 0.592294723773007 0.795644579177760 1.32591473445261 0.514447808679618 1.66981475827558 0.420461236166142 0.971024188229231 1.24150773797199 0.167235165983137 0.744157442494480 1.36712090690592 0.752053399280866 1.16478332023489 0.647038457903962 0.724319675341819 0.662367555316912 0.211150727311070 0.491454518455602 0.652468822237651 1.07530022810567 1.04693715865955 0.709416973009441 1.55268631658480
1.19074525093414 0.223090185381988 0.763288657913431 -0.470752446615612 1.06490425683599 1.99256380900513 0.755467103809145 1.30542965019448 0.417612742714665 0.697096391244814 0.970330638315692 1.82907439471083 1.43062144490733 1.87995224178183 0.653240192567877 1.85034137979122 0.439773153965432 1.03212934298738 0.836077995799010 2.19603449774367 0.669933536275130 1.39583811208594 1.43878548191482 2.00788970426808 1.00510949069882 0.218929077204593 1.72454042531373 moment1=mean(A) %计算样本均值 moment1 =
0.9981
moment1=sum(A)/100 %也可以自己编程解决 moment1 =
0.9981
variance=sum((A-moment1).^2)/100 %计算样本方差 variance =
0.2910
standardvariance=sqrt(variance) %计算样本标准差方差 standardvariance =
0.5394
说明:从模拟结果看,效果还可以。
以上所定义的样本均值、样本方差是最常用的统计量(是随机变量,不是数,但是总体的均值和总体的方差却是具体的数) 我们还定义
四:次序统计量
定义:样本X1,...,Xn由n个个体组成,每个个体有许多可能取值,X1,...,Xn从小到大排列,第k个大的有各种可能取值(可能是X1的观察值排在第k个位置,也可能是X2的观察值...),称为第k个次序统计量,记X?k? 例题:P271例题5.3.6
定理5.3.5:总体X~f?x?,样本?X1,...,Xn?的第k个大次序统计量X?k?的概率密度函数为
k?11fk?x??CnCn?k?1?F?x??k?1?1?F?x??n?kf?x?
例题:从[0,1]中任意取值5次,则第2个大的次序统计量X?2?平均值为多少(0.4吗?) 解:f?2??x??5?25!2?13F?x?f(x)?1?F?x???20x?1?x?I?0,1??x?,
?2?1?!?(5?2)!EX?2???xf?2??x?dx?20?B?3,4??20?01??3???4?2!3! ?20???7?6!?1 3 模拟
A=unifrnd(0,1,5,100) %每列的5个数据看作一次样本观察,每次观察得到一
个%X?2?的值,独立进行100次观察
C=[];
for i=1:100 %对于100次观察试验
B=sort(A(:,i)); %取出第i次样本观察的数据(5个数据)从小到大排列 C=[C,B(2)]; %取出第i次试验的数据第3个大的赋值矩阵C后 end
mean(C) ans =
0.3082
定理5.3.6:总体X~f?x?,样本?X1,...,Xn?的第i个大次序统计量X?i?与第j个大次序统计量(i 0x?y??fij?x,y??n!i?1j?i?1n?jF(x)F(y)?F(x)1?F(y)f?x?f?y?x?y???????(i?1)!(j?i?1)!(n?j)? 作业P280 22 24