要用于有计量单位的连续和定量数据,拟合优度检验虽然也可以用于定量数据,但必须先将数据分组得到实际观测频数,并要求多变量之间独立,而K-S正态检验法可以不分组直接把原始数据的n个观测值进行检验,所以它对数据的利用较完整。
三、Lilliefor正态分布检验
该检验是对Kolmogorov-Smirnov检验的修正,当总体均值和方差未知时,Lilliefor提出用样本均值和标准差代替总体的期望和标准差,然后使用Kolmogorov-Smirnov正态性检验法,它定义了一个D统计量;
D=max Fn(x)- Fo(x)|参数未知,由计算得
到统计量,查表得Lilliefor检验的临界值,确定拒绝域,得出结论。
四、偏度峰度检验法: (一)偏度检验:
设随机变量 X 具有数学期望 和方差,为X的
偏度,所谓偏度检验就是检验如下假设:
:=0
注意到,拒绝原假设,则可以认为样本不是来自正态总体。接受原
假设,并不等价于接受原假设“样本来自正态总体”。这是因为任
一对称分布的偏度都为0,无法排除样本来自非正态的对称分布的可能。因此,偏度检验只能检验数据分布的对称性。
由于总体分布未知,无法直接得到总体的偏度,故可以利用样本偏度作为检验上述假设的检验统计量,记
定义1 设
验的检验统计量为
(*)
为随机变量X的n个相互独立的样本,偏度检
常被用于双尾检验,因为非正态分布可能出现左偏,也可能出现右偏。在原假设成立时,分位点
,若
,在显著性水平
下取定的分布是对
,则拒绝原假设。事实上,
称的,因此采取双尾检验的做法是合理的。
定理1 设为(*)式中定义的偏度检验统计量,则渐进服从均
值为 0,方差为6的正态分布,即
样本容量有限的情形,使用渐进情形下的结论就会导致较高的出错率,这也是偏度检验的一个缺陷。需要指出的是,只有在确定对称性是唯一影响分布的形态时,偏度检验才是合适的选择,否则应该避免使用偏度检验。 (二)峰度检验
设随机变量 X 具有数学期望和方差,为 X 的峰
度,所谓峰度检验,实际上是将正态性检验转化为检验如下假设:
如同偏度检验一样,峰度为 3 的非正态分布也是存在的。所以,接受原假设
并不能表明 X 一定服从正态分布,这一事实也导致对
数据的正态性检验会有一定的出错率。
定义2 设检验的检验统计量为
为随机变量X的n个相互独立的样本,峰度
(*2)
定理 2设为(*2)式中定义的峰度统计量,则
同偏度统计量一样,的收敛速度也是比较慢的.
五、小样本场合(3 w检验是检验样本容量n ≤50时,样本是否符合正态分布的一种方法。其检验步骤如下: ①将数据按数值大小重新排列,使x1≤x2≤?≤xn; ②计算 (X? i?1ni?X)2③计算 式中:当n为偶数时,i=n/2;n为奇数时,i=(n-1)/2; 值可查表得出; ④计算检验统计量 [n2]i?1W?[?ai(X(n?1?i)?X(i))]2?(Xi?1ni?X)2 ⑤若W值小于判断界限值Wα(可通过查表求得),按表上行写明的显著性水平α舍弃正态性假设;若W>Wα,接受正态性假设。 六、大样本场合(50 检验统计量: D??(i?i?1nn?1)X(i)22?X)(i)(n)3?(Xi?1n 再令 则在显著性水平时,拒绝域为 分别为Y的 和 分位数。 。其中 总结 在各种正态性检验方法中,一般通用的方法有?检验以及K检验,但检验精度较低。 偏度检验对非对称、长尾分布较敏感;峰度检验对对称分布较敏感;W 检验对各种分布(特别对非对称分布)都很敏感。当总体均值和方差未知且无先验信息时用Lilliefor正态检验.大样本情况下D检验是比较好的检验方法。但我们要知道,检验方法的功效性都是随着样本量的增大而增大的。 2