值中内插新的节点值把一个(M+1)*(N+1)数组拓展成一个(2M+1)*(2N+1)数组。由是,EXPAND用于高斯金字塔的排列
假设
是
并且
和
和节点i,j
就会得到排列
,与
规模相同。
拓展n次得到的结果。那么
通过EXPAND我们意思是,对于等级
(2)
只有有着(i-m)/2和(j-n)/2形式的才包括在这一加和中。
如果我们对图像
使用l次EXPAND函数我们可以得到
,和初始图像
尺寸相同,
尽管完全展开不会再图像编码中使用,我们会使用他来帮助显示出金字塔构造中不同的排列的内容。通过展开图4中的金字塔等级图5的最高一排显示出图像高斯金字塔的低通滤波影响现在清楚的表现了出来。
图4.对于“女士”图像的高斯金字塔的前六等级 初始图像 等级0,由257*257像素组 成,每个更高的等级排列的维度大致比前者有一半的像素,由是,等级5只有9*9像素
拉普拉斯金字塔
回忆一下我们构造被削减的图像
的目的是它可能成为一个初始图像
减去被拓展的图像
像素值的预
测。为了得到一个压缩过的表达,我们编码一个的剩下的错误图像。
这个图像成为了拉普拉斯金字塔的底部等级。下一等级是以同样的方法编码们现在给拉普拉斯金字塔一个正式的定义,并测试他的性能。
拉普拉斯金字塔生成
拉普拉斯金字塔是一个错误图像字塔的两等级间的差别。由是,对于
得到的。我
的序列。他们中的每个都是对应的高斯金,
由于没有图像
等价权重函数
拉普拉斯金字塔中每个节点的值是两个等价权重函数
和初始图像的卷积的差
作为
的预测图像,我们声明
。
异。这类似于将一个适当规模的拉普拉斯权重函数和图像进行卷积。尽管计算消耗非常大,
节点值可以通过进行这种操作来得到。
就像我们将高斯金字塔视为一系列原始图像通过低通滤波器所得到的产物,我们也可以将拉普拉斯金字塔视为一系列原图像通过带通滤波器所得到的产物。金字塔层级变化时,拉普拉斯操作的规模加倍,同时通频带的中心频率减少八度。
为了举例说明拉普拉斯金字塔的内容,在样本点中插入是很有帮助的。这也许通过在高斯金字塔的金字塔结构中内插来得到。让
作为使用(2)展开
n次得到的结果。那么
就是原始图像的尺寸。
图4中“女士”图像的展开的拉普拉斯金字塔等级在图5最底行中给出。注意图像特征比如边缘和小节在拉普拉斯金字塔中出现了增强。增强的特点被尺寸分隔开来:在
中
突出了很好的细节,而更高等级的图像中粗糙的特点逐渐增多。 解码
可以看出原始图像可以通过展开来还原得到,之后将拉普拉斯金字塔的所有等级相加。
(4)
一个更加有效率的过程是将等级0,我们看到
展开一次然后把它加到
上,然后继续这样做直到
就还原得到了。这一过程简单的反转了拉普拉斯金字塔生成的过程。从(3)中
并且对于
有
信息熵
如果我们假定一幅图像表示的像素值是统计独立的,那么编码这幅图像时每个像素需要的最小比特数就是由像素价值分布的熵给出。这一合适值也许可以在实际应用中通过如可变长度编码等方式来接近。
图像“女士”的像素值直方图在图6(a)中给出。如果我们让观察到的每个灰度等级i出现的频率f(i)作为它在这个和其他类似图像中出现概率的估计,那么信息熵可以由下式给出:
图5.高斯金字塔和拉普拉斯金字塔的前四级,上面一排是通过高斯内插展开图4的金字塔排列得到的。每个拉普拉斯金字塔的等级是两个相应的和更高一级高斯金字塔之间的差异。
图6.编码过程中不同等级的像素灰度分布。原始图像的直方图在(a)中给出。(b)到(e)给出了拉普拉斯金字塔在生成参数a=0.6时等级0-3的直方图。之后的等级的量化直方图在(f)-(i)中给出。注意拉普拉斯金字塔的像素值在0附近集中。
由于图像最初由256个灰度等级来表示在这种情况下最大的信息熵为8,在所有的灰度等级都均等时会出现。对于“女士”的实际估计值要略小于这一值,为7.57.
就像在拉普拉斯金字塔变换中使用的那样,从每个图像像素中减去一个预测值的技术移除了大部分的像素与像素间关系。去相关也同时导致了像素值在零周围集中,同时减少了方差和信息熵。这一减少的程度由生成参数“a”决定(看图7)。在我们的例子中我们发现a=0.6时这种减少效果最大。较之于更小的a值如0.4(会生成更多的等权重函数)在以这一a值构建高斯金字塔时它的等级呈现出“保鲜”的效果。因此,选择a=0.6同时具有感知的和计算的有点。对应的拉普拉斯金字塔和他们的直方图在图6(b)-(c)中给出。方差(
)
和信息熵(H)也在每级中给出。这个例子中,我们可以发现这些量化的值在等级到等级间提升。
量化
信息熵在通过对拉普拉斯金字塔的每级像素值做量化时会大幅减少。这就引出了量化错误,但通过合适的量化等级数字和分布的选择这一错误可以被减少至几乎无法被人观察到的程度。我们使用统一的量化来举例说明这一过程。像素值的范围被分进尺寸为n箱子中,像素
的量化值
正好是包含
的箱子的中心值
(5)
图7对于“女士”图像生成参数为“a”时像素值的信息熵和方差。当a=0.6时下降最大,对于金字塔的其他等级同样有此结论
图8 在拉普拉斯金字塔编码下图像数据压缩的例子 (a)和(c)给出了原始的“女士”和 “Walter”图像,而(b)和(d)给出了他们对于“女士”和“walter”数据率分别为1.58和0.73bits/pixel的编码版本。分别对应方形错误为百分之0.88和百分之0.43
使用C值而非L值,通过展开和加和过程(4),量化的图像得以重现。
量化图像“女士”的结果在图6(f)-(i)中给出。每一级的箱的大小由一个上升的n得到,直到退化已经在约为图像五倍宽度的距离时能被人察觉到。注意箱的大小在高金字塔等级时更小(更小的空间频率)。一个给定的金字塔等级的选择的箱的大小反映了人类对于