第四章 统计判决
4.1 使用最小最大损失判决规则的错分概率是最小吗?为什么? 4.2 当?i=?2I时,先验概率对决策超平面的位置影响如何?
4.3 假设在某个地区的细胞识别中正常 正常状态 : 异常状态:
?1和异常 ?2两类的先验概率分别为
P(?1)?0.9
P(?2)?0.1
p(x?1)?0.2,p(x?2)?0.4
现有一待识的细胞,其观测值为x,从类条件概率密度分布曲线上查得 并且已知损失系数为?11=0,?12=1,?21=6,?22=0。
试对该细胞以以下两种方法进行分类:①基于最小错误概率准则的贝叶斯判决;②基于最小损失准则的贝叶斯判决。请分析两种分类结果的异同及原因。
4.4 试用最大似然估计的方法估计单变量正态分布的均值?和方差 ?。
2
4.5 已知两个一维模式类别的类概率密度函数为
? x 0≤x<1 p(x??1)=? 2-x
1≤x≤2
? 0 其它 ? x?1 1≤x<2 p(x??2)=? 3-x 2≤x≤3 ? 0 其它
先验概率P(?1)=0.6,P(?2)=0.4, (1)求0-1代价Bayes判决函数; (2)求总错误概率P(e);
(3)判断样本?x1=1.35,x2=1.45,x3=1.55,x4=1.65?各属于哪一类别。
4.6 在目标识别中,假定有农田和装甲车两种类型,类型
?1和类型
?2分别代表农田和装甲车,它们的
先验概率分别为0.8和0.2,损失函数如表1所示。现在做了三次试验,获得三个样本的类概率密度如下:
p(x/?1):0.3,0.1,0.6
p(x/?2):0.7,0.8,0.3
(1) 试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型;
(2) 假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一个类型; (3) 把拒绝判决考虑在内,重新考核三次试验的结果。
类型 损失 判决
表1
?1 0.5 5 2 ?2 3 1 2 ?1 ?2 ?3
4.7已知两个一维模式类别的类概率密度函数为
?2x, 0?x?1p(x|?1)???0, 其它 ?2?2x , 0?x?1p(x|?2)???0 , 其它
先验概率P(?1)=P(?2),损失函数,?11=?22=0,?12=0.6,?21=0.4。 (1)求最小平均损失Bayes判决函数; (2)求总的误判概率P(e);
(3)对于一个两类一维问题,若这两类的类概率密度分别服从正态分布N(0,?)和 N(1,?),证明使平
2
2
x0?均决策风险最小的决策门限为
?P(?2)1??2ln212?12P(?1)
p(x)?这里,假设风险函数?11=?22=0 。一维正态分布:
12??e[?(x??)22?2]
???1N??(N))(x?(N))T?C(N)??(xj?m?m????j?x,x,...,xNN(m,C)j?1N}对总体 x? 4.8 设是基于样本集{ 12???x的协方差矩阵的最大似然估计。试推导由 C(N)求增加一个样本 N?1后协方差矩阵的估计 C(N?1)???????x,x,...,xm(N)mx12N的递推公式。其中, 是基于样本集{ }对总体 的均值向量 的最大似然估计
?1N??m(N)??xjNj?1 。
4.9 设以下两类模式均为正态分布 ?1:{(0,0),(2,0),(2,2),(0,2)} ?2:{(4,4),(6,4),(6,6),(4,6)}
(1) 设P(?1)= P(?2)=1/2,求该两类模式之间的Bayes判别界面的方程。 (2) 绘出判别界面。
4.10 设以下两类模式均为正态分布
?1:{(-5,-5),(-5,-4),(-4,-5),(-6,-5),(-5,-6) } ?2:{(5,5),(5,6),(6,5),(5,4),(4,5) }
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
????p(x|?)p1和 (x|?2),可选用Hermite正交多项式前(1) 试用正交函数逼近法求类概率密度的估计
四项低阶基函数:H0(x)=1, H1(x)=2x,H2(x)=4x-2, H3(x)=8x-12x; (2) 设P(?1)= P(?2)=1/2,求Bayes判决函数; (3) 给出判别界面方程和图示。
4.11 证明在多类问题中,贝叶斯决策准则使错误分类概率最小。
提示:使用正确分类概率来证明要方便一些。
4.12 在一个两类一维问题中,两类的概率分布密度函数分别为高斯分布N(0,?)和 N(1,?),证明
使平均风险最小的门限
222
3
x0为:
12??x02?ln
?P??2??P??1?2112 其中
?11??22?0。
??11?12???????2122??,?1是将本来属于?1类的样本错分为?2的概率,4.13 假设两类类问题中损失矩阵为L=
?2是将本来属于?2类的样本错分为?1的概率。试证明平均风险为
4.14 证明在多类分类问题中,M类的分类错误概率上限为 Pe=(M-1)/M 。
提示,对于每一个向量x最大后验概率密度函数价于每一个
P(?i|x),i=1,2,?,M,大于或等于1/M。这等
P(?i|x)都是相等的。
4.15 假设在一维两类分类当中样本点符合Rayleigh概率密度函数分布:
?x?x2?exp(2) x?0p(x|?i)???i22?i? x?0 试求判决边界g(x)?0。 ?0
4.16在两类分类问题中,限定其中一类的错分误概率为?1=?,证明,使另一类的错分概率?2最小等价
于似然比判决:如果P(?1)/P(?2)> ?,则判x??1,这里,?是使?1=?成立的似然比判决门限。 注:这就是Neyman-Pearson判决准则, 它类似于贝叶斯最小风险准则。 提示:该问题等价于用Langrange乘子法,使q=?(?1-?)+?2最小化。
4.17.二维三类问题,假设每一类都服从同一正态分布,且特征向量的的协方差矩阵为
?1.20.4????0.41.8???
各类的均值向量分别是
?0.1,0.1?,?2.1,1.9?,??1.5,2.0?。
TTT
(1)用贝叶斯最小错误概率分类器将向量
?1.6,1.5?分类。
T(2)画出距离向量
?2.1,1.9?的等马氏距离曲线图(略图)
。
T4.18. 在两类三维空间分类问题中,每一类中的特征向量都服从正态分布,协方差矩阵为
?0.30.10.1??0.10.3?0.1???????0.1?0.10.3??
这两类的各自的均值向量分别为和决策界面方程。
4.19.在两类等概率分类问题中,每一类中的特征向量的协方差矩阵均为?,相关的均值向量为
证明对于贝叶斯最小错误概率分类器,错误概率分布是
?0,0,0?和?0.5,0.5,0.5?。试推导相应的线性决策函数
TT
?1,?2,
P
其中,
B????(1/2)dm1exp(?z2/2)dz2?
dm是这两个均值向量之间的马氏距离。该函数是 dm的增函数。
提示:对数似然比
u?lnp(x|w1)?lnp(x|w2)是一个随机变量,且服从高斯分布:
?122???dm,dm??2?,?
?122????dm,dm?x??1;和 ?2?,? x??2。据此计算错误概率。
4.20.证明假设每个向量都遵循高斯概率密度函数分布,在(2。19)的最大似然概率检测
x??1(?2)if等价于
p?x|?1?l12?p?x|?2??(?)?
2d??2m1,x|?1?dmii???2,x|?2?ln?
??????2ln??
12,x|?????d这里是
2m
i和x之间关于
?矩阵的的马氏距离。
i