经验数据是很难估计出条件密度和结构函数的。这是计算贝叶斯保费的第一个困难。此外,即使知道或估计出了条件密度和结构函数,由于积分(或求和)计算的困难和复杂,很难得到贝叶斯保费的明显表达式。这是计算贝叶斯保费的第二个困难。由于这两个困难,贝叶斯保费不实用。正因为如此,瑞士精算学家Buhlmann提出,将基于历史经验数据预测下一期保费压缩为基于历史经验数据的线性函数预测下一期保费。范围缩小,所求得的预测保费不可能比原来的好。但由于Buhlmann提出的方法计算简单,且容易理解,一直沿用至今。 5.3.2 Buhlmann信度模型
设随机变量X表示某一险种的实际损失。?为其风险参数。记?????E?X|??,
v????Var?X|??。在上一节我们已经知道,????称为假设均值,或风险保费。它是一种
体现风险特征的保费。v???称为过程方差(process variance)。它度量了相同风险水平的内在差异。令
??E?X??E?E?X|????E?????? v?E?Var?X|????E?v???? a?Var?E?X|????Var??????
????是风险参数为?时,X的条件均值。而?是不同风险参数,X的条件均值的平均。所
以?称为X的总的均值,可视为在没有投保人风险水平的任何信息时,对其征收的保费。
v???衡量了相同风险水平的内在差异,v为它的均值(expected value of the process variance),
称为X的同质方差。v比较小,意味着相同风险水平的内在差异都不大。风险保费????依赖于风险参数?,a为它的方差(variance of the risk premium)。a描述了因风险水平不同质导致的差异,称为X的异质方差。a比较大,意味着不同风险水平之间的差异较为显着。所以v比较小,a比较大,意味着风险的分类比较合理。在Buhlmann信度模型中,称?,v和a为结构参数(structure parameters)。为了计算贝叶斯保费,必须知道条件密度f?x|??和结构函数????。而计算Buhlmann信度保费,只需要知道结构参数?,v和a的值。基于历史经验数据,不难估计出结构参数?,v和a的值。
例5.3.1 (例5.2.1的续) 由于X的分布为Poisson分布P???,所以?????E?X|????,
v????Var?X|????。
(1) 取?的结构函数为
? 0.1719 0.8876 1.4694 0.1124 ???? 则
??E???????E????0.1719?0.8876?1.4694?0.1124?0.3177 v?E?v?????E????0.3177 a?Var???????Var???22?0.1719?0.8876?1.4694?0.1124?0.31772?0.1680
(2) 取?的结构函数为伽玛分布,其密度函数为
????1?????????e,其中??0.5807,??1.8284
????由于伽玛分布的均值和方差分别是??和??2,所以
??E???????E????0.58071.8284?0.3176 v?E?v?????E????0.3176
2a?Var???????Var????0.58071.8284?0.1737
由定理5.2.1,我们知道X的总的方差等于X的同质方差与异质方差之和:
Var?X??v?a (5.3.2)
假设X1和X2的风险参数相等,都等于?。则在?给定的条件下,X1和X2条件独立。从而Cov?X1,X2|???0。但是Cov?X1,X2?一般不等于0。
定理5.3.2 若X1和X2的风险参数相等,则
Cov?X1,X2??a。
证明:由于
Cov?X1,X2??E?X1X2??E?X1?E?X2?
E?X1X2??E?E?X1X2|????E?E?X1|??E?X2|????E??????2 E?X1?E?X2??E?E?X1|???E?E?X2|?????E???????2
所以
??Cov?X1,X2??E??????2??E???????2?Var???????a
定理得到证明。
应该指出的是,在X1和X2的风险参数不相等时,Cov?X1,X2??0。
在前期历史数据x1,?,xn的风险参数都相等时,则由x1,?,xn的条件独立性,有
??Var?x|????in?1Var?xi|??n2?v???n
n其中x??i?1xin为样本均值。另由(5.3.2)式和定理5.3.2,有
Var?in?1xi??in?1Var?xi??2?Covxi,xj
1?i?j?n?????n?v?a??n?n?1?a?nv?n2a
则
Var?x??Var?in?1xin2?vn?a (5.3.3)
5.3.3 结构参数的估计
设有r组,每一组都有n个历史数据:xi1,xi2,?,xin,i?1,2,?,r。同一组的历史数据的风险特征相同,不同组历史数据的风险特征不同。假设各组的风险参数分别为
?????1,?2,?,?r。假设均值???i?和过程方差v??i?的常用估计分别为
???i??xi??n?j?1xijn
???i???nvj?1xij?xi??2?n?1?
???i?和v???i?的平均为它们都是无偏估计。考虑到??E??????,v?E?v????,我们分别取??和v的估计:
???ir?1xir??ir?1?n?j?1xij?rn??x (5.3.4)
???ir?1v???i?r??ir?1?nvj?1xij?xi??2?r?n?1?? (5.3.5)
它们都是无偏估计。考虑到a是????的方差,并注意到???i?的估计为xi,i?1,2,?,r,
r?x?x?我们取a的估计为x1,x2,?,xr的样本无偏方差:?i?1i2?r?1?。下面证明,它不是
a的无偏估计。
E?ir?1?xi?x?2?r?1???ir?1Exi2?rEx2据(5.3.3)式,由于xi1,xi2,?,xin有相同的风险参数,则
2Exi?Var?xi???E?xi??2??vn?a???2,i?1,2,?,r
?????????r?1?
????由于在i?j时,xi1,xi2,?,xin和xj1,xj2,?,xjn有不同的风险参数,它们相互独立,所以
????Ex2?Var?x???E?x??2??ir?1Var?xi?r2??2??vn?a?r??2
从而
??E?ir?1?xi?x?2?r?1??a?vn
r?x?x?虽然?i?1i2???r?1?不是a的无偏估计,但由于它的均值为a?vn,我们可以将它修
???ir?1?xi?x?2?r?1??v?n (5.3.6) a改为无偏估计。修改后的估计为
?如(5.3.5)所示。由于v?是v的无偏估计,所以 其中v???E?ir?1?xi?x?2?r?1??E?v??n?a E?a?是a的无偏估计。 a如果各组的数据个数不一定都相等,比如分别有n1,n2,?,nr个历史数据:
???xi1,xi2,?,xin?,i?1,2,?,r。则?、v和a的估计分别为
ii???ir?1nixi?ir?1ni??ir?1?n?j?1xijN?x (5.3.7)
i???ir?1?ni?1?v???i??ir?1?ni?1???ir?1?nvj?1xij?xi??2?N?r? (5.3.8)
???ir?1ni?xi?x?2??r?1?v?N??ir?1ni2N (5.3.9) ar?如(5.3.8)所示。可以证明,其中N??i(5.3.9)中的v它们都是无偏估计。 ?1ni为数据总个数,
????例5.3.2 假设某保险公司有两份保单。这两份保单的风险特征不同。前4年各份保单的逐年索赔次数的记录如下:
1 第1份 第2份 则
4 12 2 10 14 年份 3 8 13 5 6 13 x1??4?10?8?6?4?7,x2??12?14?13?13?4?13,
据(5.3.4)、(5.3.5)和(5.3.6)式,结构参数的估计为
???7?13?2?10 ???(4?7)2???(6?7)2?(12?13)2???(13?13)2?2(4?1)??113 v???(7?10?2?(13?10)2?2?1???113?4?20512 a5.3.4 Buhlmann方法
考虑到贝叶斯保费计算的困难性,瑞士精算学家Buhlmann提出,基于x1,?,xn的线性函数???1x1????nxn预测下一期保费Xn?1。这个线性函数称为线性保费。?i是xi在线性保费中的权重,i?1,?,n。由于x1,?,xn的风险特征都相同,所以只有当他们的权重都相等时,这个线性保费才是合理的。在权重?1????n时,???1x1????nxn
?????n?1x。令z?n?1,则线性保费化为??zx。最优线性保费称为Buhlmann信度保费
(Buhlmann credibility premium),简称信度保费。
作为下一期保费Xn?1的预测,信度保费??zx应该与Xn?1最接近。Buhlmann取均方损失函数
E???zx?Xn?1?2 (5.3.10)
衡量??zx与Xn?1的接近程度。信度保费应该是使得均方函数(5.3.10)式达到最小的
????zx。这是寻求信度保费的第一条途径。另一条途径是取均方损失函数
E???zx??????2 (5.3.11)
衡量??zx与????的接近程度。信度保费应该是使得均方损失函数(5.3.11)式达到最小的
????zx。可以证明,这两条途径是等价的,所寻找到的信度保费是相等的。