公式(4)
这样,该两个参数可以由如下公式来确定:
公式(5)
其中N1和N2分别为两个区域内的像素点个数。联合以上公式1、2和5可以得到:
公式(6)
阈值可以选取为:
公式(7)
其中t0即为所需要的门限值。以上的和在整幅图像上进行,尽管如此,有一些可替换的计算可分类。这样就得到了如下的公式:
公式(8)
以上模型中的交叉熵的形式看起来和Skilling推倒的图像分割方法很相似,在他的方法中用到了4个公理推出如下的熵函数:
公式(9)
其中 f(x)是图像强度分布函数,m(x)是图像模型。实际上,如果包括总的强度转换限制,这两个方程只差一个符号,因为8公式中的两个积分在整个类上积分将会抵消。
以上的方法介绍了最小化图像和分割区域之间的交叉熵。大津法最小化类间方差也可以从以上的方法中推导出来,这要用到两幅图像之间的均方差并且如4式所示的同样的限制。这样标准函数就变为如下形式:
公式(10)
用直方图进行分类,标准函数就如下所示:
公式(11)
类内方差6式进行了定义,最小化11式所定义的函数等效于最大化大津法的准则,因为类内方差以及类间方差的和与选择的阈值相独立。
交叉熵函数的使用不仅仅限于阈值图像分割。结合其他的限制,可以将该算法扩展到图像分割的其他领域。例如,有些基于区域的分割方法就用交叉熵作为准则,比如分裂与合并方法,合并的地区可根据空间坐标标签的限制来确定。
4、算法的应用和讨论
为了进行对比,这里采用Kittler和Illingworth提出的算法,大津算法,最小误差方法以及最小交叉熵算法被用于参考文献5所讨论的正态分布。这些直方图如图3-5所示。我们同样采用了真实工业图像的直方图。根据这些方法所选择的阈值在表1中展示。
图3 直方图a
图4 直方图b
图5 直方图c
图6 直方图d
前三个直方图的对高斯分布结果可以总结为:最小误差方法将正态分布作为模型,随后优于最小交叉熵和大津算法。尽管如此,最小交叉熵能够给出一个优化的阈值,这个数值相比大津算法和最大熵算法更加接近于最有的阈值。
对于图7所示的劳损测量图像,我们的目标是测量椭圆形的主轴和次轴的变化,这些将会给出金属的应变信息。第一步是进行平行线和椭圆从背景中的分割。直方图被提取出来如图6所示。最小误差法没有给出任何阈值信息,因为针对该标准函数没有内部最小值存在。直方图将其错误的推断为单峰,而实际情况是这两个分布因为有大量噪声而高度重叠。这表明错误的假设可能是灾难性的。最小交叉熵方法和大津法能成功的选取阈值,相比其他方法该阈值能够使得分割图像有较低的噪声水平。
为了进行证明,对比图8和图9、图10,图8显示了最小交叉熵法的分割图像(选定的阈值为40),图9和图10分别显示了小于40与大于40时的分割图像。图9中出现了更多的洞,还有开裂的线条以及椭圆。图示包括了太多的背景。这说明了选择正确的阈值是很关键的,因为他将产生高度重叠的分布。