共33页 河南理工大学本科毕业论文外文文献资料翻译 第 20 页
三参数威布尔、对数正态及伽马分布下的估计
Russell F. KAPPENMAN
西北和阿拉斯加渔业中心,国家海洋渔业局,国家海洋气象局,美国华盛顿州西雅图98112
1984年4月收到 1984年11月修订
摘要:威布尔分布、对数正态分布、伽马分布的的位臵、尺度、形状参数的新估计是发达的.估计是在封闭的形式,他们并不需要同步的非线性方程组求解.模拟研究结果和其他人已经提出的新的估计的性能进行比较.这些研究表明,新的估计更好,至少考虑到可能的偏差和均方误差.
关键词:位臵、尺度和形状参数,最大似然估计法、矩估计法,参数估计,仿真
§1引言
概率密度函数下三参数威布尔、对数正态和伽马分布的形式分别为:
??f?x;a,b,c???12?c?x?a??exp???ln??x?a?b??2c?
f?x;a,b,c???cb???x?a?b?expln??x?a?b?c?1c?1222f?x;a,b,c???1b??c????x?a?b?exp???x?a?b?在每种情况下,a是位置参数,b是尺度参数,c是形状参数.在这里所考虑的问题是给定一个随机从这些分布中观测的样本,来评估a,b,c.我们提出各个分布的参数估计,进行模拟仿真,然后和其他人提出的估计量的性能作对比.
在一系列的论文中,Cohen and Whitten [2-4]报道他们运用最大似然法、改进的最大似然法和矩估计法估计三参数威布尔分布、对数正态分布、伽马分布的研究成果.在考虑多种不同的可能性,他们提出对每个分布的估计建议.对于对数正态分布的位置、尺度、形状参数估计,已经由Munro and Wixley [11]提出及LaRiccia和Kindermann[10]进一步研究.检查估计在这些论文中设计使用迭代或搜索过程,来同时解决三个非线性方程.迭代或搜索过程有时无法找到方程的解.因此,它很有可能,在任何给定情况下,该程序将无法得到参数估计,即使样品来自假定分布.尤其是来自一个真实的中小程度大小的样本.
本文提出的估计有三个重要优势,相比那些仅仅是引用的.首先,它们是相对比较简单的,也就是说,它们是在封闭形式而涉及非线性方程的数值解.第二,估计总是能被发现.最后,最重要的是,这些估计量似乎完成一些东西比那些到这个时候提出的好,至少考虑到偏差和均方误差.
这里考虑的三种分布的参数估计都是来自一种相似的方式中.然而,不同的情况可以根据基本的开发方案稍作修改或调整.估计量的发展本质上源于 Wyckoff, Bain, and Engelhardt [12],因他们的工作单单只是威布尔案例.他们的发展是稍做改进的威布尔分布产生较好的估计值,并产生了
指导教师:李文玲 学生:闻晶晶
共33页 河南理工大学本科毕业论文外文文献资料翻译 第 21 页 类似的对数正态分布和伽马分布的参数估计量.
对于三个分布中任何一个,我们产生参数估计通过(1)以最初的、非参数估计量的位置为初始位置;(2)假设等于它的初始估计,并寻找形状参数的初始估计;(3)设置第一个次序统计量等于其预期值;(4)在形状参数被其初始估计替换后方程的解为位置参数,位置参数的一个函数替换尺度参数;(5)估计的尺度和形状参数通过假定位置参数等于(4)中得到的参数值.
在以下三部分我们将详细介绍,我们将轮流检验威布尔分布、对数正态分布和伽马分布.在 下文中,x1,x2,…,X,N,表示一个随机样本的N个观测的分布的参数估计量的次序统计量,Y代表样本均值,s表示样本的方差,F表示经验分布函数.通常,100p百分位数是样品xq,其中
2q?np,若np是整数,则q?1??np?,否则,?np?表示不超过np的最大整数.100p分布百分位上
是Up,F?Up??p.
§2威布尔分布
Wyckoff, Bain, and Engelhardt [12]提出了下列程序估计这三参数威布尔分布.第一阶段的统计作为位置参数的初始估计.形状参数的初始估计通过假设a?x1,利用估计的c由 Dubey[6]得到两参数威布尔分布.这个估计为
?1?2.989ln??xk?x1??xh?x1?? (2.1) c其中,xk和xh分别是第94和第17样本百分位数.则威布尔分布为
??1??E?x1??a??b??1???n1c. ??c???1替换c,由此产生的方程解为a.a为了重新估计a,令x1等于其期望值,?x?a???1??1c??替换b,c?来表示,假定a?a?,然后估计参数b和c,根据Engelhardt and Bain [7],利的新的估计解用a用b和c的估计推出两参数威布尔分布.
注意,对于这个程序,b本质上是由其重新估计的矩估计量替代的,似乎三个参数的估计都因此略有改善;反之,b由xm?a替代,其中xm是第63样本百分位数.a的函数通过等同于第63百分位数样本和分布的百分比得到,后者是a?b.由此得到的a,b,c分别为
???x1?xmr?c?1???1?r?c?1?? (2.2a)a ??nkncns??????????sn?slnx?a?ln(x?a) ?? (2.2b)??iii?s?1i?1????n????????ln?xi?a???n? (2.2c)b?exp??0.5772c ?i?1???指导教师:李文玲 学生:闻晶晶
共33页 河南理工大学本科毕业论文外文文献资料翻译 第 22 页 其中,r?c?????1??1c???n1c?1已在(2.1)给出,s??0.84n?,k是一个取决于样本大小的常 ,c数.我们可以根据Engelhardt and Bain [7]中的一个表确定k值.
Cohen and Whitten [4] 研究了威布尔分布参数的最大似然估计法和矩估计法并进行了改进.他们建议在求解非线性方程组的同时找到估计.方程组的前两个方程通过使似然函数关于b和c的偏导数为零得到.第三个方程是第一次序统计量与其期望值相等,或F?x1?等于期望值1?n?1?.
Cohen and Whitten [4]提出以比较估计的性能(2.2)和改进的最大似然估计(MMLE)进行模拟统计研究.完成一个相当全面的统计量相对性能的研究所需的工作量,可以利用分布上的
?,c?b,c?,b?表示的估计量在(2.1)或最大似然估??a?b,b?与a,b的取值无关而显著减少,其中a?a计中已经给出.这样,为了比较统计量的相对性,需要假定a=0和b=1.
形状参数值c=0.5、1、1.5、2、2.5、3.5常被用于仿真研究中.对c的每一个取值,分别由生a=0,b=1,形状参数相同的威布尔分布生成500个随机样本,每个样本容量20.对于每一个样本,可得到最大似然估计和(2.2)中的估计.在这一次研究中,我们第一次尝试通过x1与其期望值相等求得最大似然估计.如果这些估计无法找到,我们将使用其他求解最大似然估计的方法.如果没有方法成功找到所求估计,样品将被舍弃.我们使用和Cohen and Whitten [4] 同样的标准,决定是否停止某一个方案.
经过500次的实验,对于每个形状参数值,有如下结果:当c=3.5时,有77次未能找到估计值;当c=2.5时,27次未找到;当c=2,3,1.5时,有8次未找到估计值.
表1给出了基于未丢弃的样本的最大似然估计和(2.2)估计的偏差和均方误差.a和c估计量(2.2)的均方误差总是远远小于那些用最大似然估计得到的a和c的估计值的均方误差.这同样适用与b估计,除了c=0.5的情况.这些结论也基本上适用于偏差比较,除了c=3.5的情况.最大似然估计的偏差在这种情况下较小. 表一
偏差和均方误差的威布尔分布参数估计使用从a= 0,b= 1的情况下威布尔分布的500个随机样
指导教师:李文玲 学生:闻晶晶
共33页 河南理工大学本科毕业论文外文文献资料翻译 第 23 页 本,样本容量为20.然而,我们再次指出,在c=3.5的情况下,77个样本被丢弃,因此,这并不有助于表1.此外,当a,b,c利用废弃的样本(2.2)的估计结果结合不采用废弃样本的估计结果,(2.2)估计的偏差大大降低了.同样适用于均方误差,除了c=3.5的情况,c的估计的均方误差略为从1.6599增加到1.8398,这仍然是远远小于其MMLE的情况.
§3对数正态分布
对一个对数正态分布的位置参数的初始估计,我们令
?? a (3.1) ?ax,
iii?1nn其中a1?1??1??1n??,ai??1??in????1??i?1?n? i?2,...,n.这种随机变量下界的非参数估
nn计是由Cooke [5]推导出来的,它似乎能实现我们猜想最好的几个可能性.
对于形状参数的初始估计c,有
?1??ln??xk?a?1??xn?k?1?a?1???2E?zk?, c (3.2)
?1由(3.1)给出,xk和xn?k?1分别是第25和第75个样本百分位数,zk是一个正态分布下一其中a个样本容量为n的随机抽样的第二十五样本百分位数.标准正态分布的次序统计量已经被Harter [9]提出.
统计量c的估计是通过假设a已知,则r?ln?xn?k?1?a??ln(xk?a)是来自一个以lnb为均值,
?1,rc为标准偏差的正态分布下四分位变化的随机样本.进一步E?r???2cE?zk?.如果我们假设a?a等同于它的期望值,求解c,所得解即为(3.2).
重新估计a,设ln?x1?a?等同于其自身期望值lnb?cE(z1).z1是标准正态分布下一个样本量为
?1替换c,a的函数替换b.对我们而言,最n的随机样本的第一次序统计量.在生成的方程中,我们用c佳的函数是y-a,其中,y是样本中位数;即y?x?n?1?2,如果n是奇数;y?xn2?x?n2??12,如果n是偶数.这个函数是通过等同ln?y?a?和它的期望值lnb得到的,求解b.a修正后的估计可由求
???2和寻找这些参数的最大似然?2,解方程的解a得到.如果这个解是a则b和c的估计可以有假定a?a?,c?估计求得,分别表示参数估计b11.
事实证明,对于对数正态分布,如果我们更进一步的话,可以改善估计量a,b,c.另一种修订
?和c?2分别替换b和c,的估计量a可以通过用b及ln?x1?a?等于其期望值的等式求得.如果使用最大1?可以重新估计a,b,c表示. 似然估计和假定a?a由上可知,最终得到的a,b,c分别为
指导教师:李文玲 学生:闻晶晶
共33页 河南理工大学本科毕业论文外文文献资料翻译 第 24 页
?n?????x1?b1r?c?2?,b????xi?a??? (3.3a) a ?i?1??1n?2?????ln?xi?a???lnb c ? (3.3b)
?ni?1?此外,
1n??12?n???2??x1?yr?c?1???1?r?c?1??, ?2??,a b1????xi?a?i?1??1n?2??2???ln?xi?a?2??lnb?cE?z1??,c r?c??exp, 1?n?i?1?1n??12?1已由(3.2)给出. Y是样本中位数,cCohen and Whitten [2]研究了对数正态分布下修改的最大似然估计法和矩估计法.他们提出,如果采样来自存在至少一个标准三阶矩的对数正态分布,则当ln?x1?a?等于其期望值,似然函数分别相对于b和c的偏导数等于0时,应在求解三个等式结果的同时进行参数估计.
因为对数正态分布的第三标准阶矩不到一个是很正常的,所以第三标准阶矩至少一个的情况是我们唯一的兴趣所在.我们应指出的是得到改进的最大似然估计参数将作为最大似然估计量.
Munro and Wixley [11]提出另一种估计,并由 LaRiccia and Kindermann [10]做过深入研究.这些估计量通过次序统计量等于其期望值,并使用加权最小二乘法估计得到.我们称这些估计量为加权最小二乘估计(WLSE’s).
第二步仿真的研究是为了比较由平稳的最大似然估计、加权最小二乘估计、(3.3)得到的估计
?,c?b,c?,b?表示研究的三??a?b,b?中a和b是自由分布的事实进行简化,其中a量.再者,我们利用?a种估计方法的任一种集合.同样,假定a?0,b?1.
在模拟研究中,我们考虑形状参数值c=0.35,0.50 ,0.80 ,1.40 和2.60.当c=2.60时,对数正态分布的曲线倾斜程度较大;c=0.35时曲线几乎是对称的.对于上述c的每一个取值,a?0,b?1的对数正态分布中,随机产生500组样本容量为25的样本,三种估计方法的比较要运用到每一组样本的比较中.如果最大似然估计或加权最小二乘估计法不能找到参数估计,则将样本丢弃. 表二
以下为500组样本容量为25,a?0,b?1的对数正态分布参数估计的偏差和均方误差.
指导教师:李文玲 学生:闻晶晶