首页>论文>正文
日期
03/17
2006
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

基于PCNN的不规则分割区域压缩编码
收藏
2006-03-17 16:53:07来源: 马义德

基于PCNN的不规则分割区域压缩编码
马义德    齐春亮    钱志柏    史飞    陈娜
兰州大学信息工程学院,兰州,730000

摘 要:本文提出了一种基于简化脉冲耦合神经网络(PCNN)模型的不规则分割区域压缩编码方法。由于PCNN局部连接域的作用及阈值指数衰减特性,使得具有近似灰度特性的临近像素能够同时处于激活状态,这就构成了PCNN分割特性的基础。通过PCNN模型的各项参数的调整,使得图像分割结果既能较好的包含原始图像细节信息,又能避免一些无意义的小分割块的产生。然后,为了有效的近似各不规则分割区域,本文采用施密特正交化方法,从一组线性独立的初始函数构造一组正交基函数。采用该方法,使重建图像的质量得到显著提高,同时也使得逐步重建图像成为可能。
关键词:脉冲耦合神经网络;正交基;分割图像编码;施密特正交化
Abstract: A irregular segmented region coding algorithm based on Pulse Coupled Neural Network (PCNN) is presented in this paper. PCNN has the property of local interconnection and changing threshold through which those adjacent pixels that have approximate gray values can be pulsed simultaneously. So PCNN has the foundation of realizing the regional segmentation. And through the adjustment of the parameters of PCNN, segmented images that contain the details of origin can be achieved and at the same time the trivial segmented regions may be avoided. For the better approximation of irregular segmented regions, the Gram-Schmidt method, by which a group of orthogonal base functions is constructed from a group of linear independent initial functions, is adopted. Because of the orthogonal reconstructing method, the quality of reconstructed image can be greatly improved and the progressive image transmission also becomes possible.
Keywords:pulse-coupled neural network;the orthonormal basis;irregular segmented region compression coding;Schmedit orthonormalization  

 1 引言
    迄今为止,基于分块操作的图像压缩方法由于具有计算速度快、不需图像的形状信息等优点而获得广泛应用,如静止图像压缩标准JPEG[1],以及视频压缩标准如H.261[2]、MPEG[3,4]等。但是这类压缩算法也有其自身固有缺陷,如在各块的边界存在灰度的不连续性(方块效应),将对重建图像的主观质量产生极大的影响;同时,由于这类算法采用固定大小的块,通过舍起步分高频系数来获得压缩效果,因此只能获得中低程度的压缩比。为了克服这些缺陷,获得更高的压缩率,许多专家学者进行了广泛深入的研究,并提出了所谓的第二代图像压缩技术[5,6],其中基于分割的图像编码[7]具有广阔的发展前景。
2 基于PCNN的图像分割
    分割图像编码的关键在于找寻最佳的图像分割算法,该算法应该能够依据某种已定的近似准则,将原始图像I分割为不同区域Rj,各个区域中的像素都满足该近似准则,具有某种相似性,通常这种相似性是指各像素灰度值上的近似。此外,各分割区域还应互不重叠,并且能够完全恢复原始图像。即 。由于分割图像编码能够和原始图像自然边界较好的吻合并且按照近似准则进行图像分割,因此与块编码技术相比较,它更符合人的视觉系统(HVS, Human Visual System)[8],能够获得更高的压缩比和更令人满意的重建图像。
    通过对小型哺乳动物的研究演化而来的脉冲耦合神经网络(Pulse Coupled Neural Nets, PCNN)算法是一种基于神经生理学的模型,它由神经元组成,每个神经元通过下面的迭代等式实现具体运算:

S表示输入激励,通常是点(i, j)的像素灰度值,每个像素对应一个神经元;F对应神经元的输入部分, L是连接输入,U对应神经元内部活动项,Y和q分别是神经元的输出和动态阈值,m、w对应神经元的内部连接矩阵。公式(4)说明神经元的输出只有0、1值,当内部活动项U大于此时的动态阈值q 则输出1,反之,则输出0。因此PCNN每次迭代的输出图像是二值图像。各神经元对应的阈值q按照公式(5)依指数规律衰减,衰减系数为aq。由公式(3)可知,内部活动项U的取值则由神经元的输入项F和连接项L共同决定。当前像素和周围像素之间相互作用的大小可通过连接系数b调节。由于PCNN的连接域特性,使得当某一神经元的内部活动项大于动态阈值而输出脉冲1时,该神经元周围W邻域内具有近似输入激励的其它神经元在下次迭代时,受连接输入的影响也被激活输出脉冲。因此具有近似灰度的像素对应神经元受连接域的作用而同步激活的特性使得PCNN非常适合作为分割图像编码的分割算法[9]。
    由于PCNN模型的各参数对个神经元的状态起着重要作用,因此寻找针对不同输入图像的最佳参数成为一项繁重的工作[10]。为此,我们采用如下的简化PCNN模型:
                                
    在初始状态,除输入激励Sij外,其他参数均设为零。第一次迭代完成时,所有神经元将输出1,此后动态阈值被提升至一预设值Vq。然后各神经元按照公式(6)~(10)进行迭代运算。对PCNN第n次迭代后输出的二值图像再按照空间相邻与否标记为不同的区域,对每次迭代结果进行同样的操作,直至所有像素对应神经元均被激活过一次。这样最终各分割区域中的像素同时具有灰度值和空间上的近似性。
3 利用正交基重建原始图像
    设f(x,y)对应图像各像素的灰度值,(x,y)对应像素点的坐标,f¢(x,y)是f(x,y)的近似函数,它由N个基函数j1, j2, ¼¼, jN组成,相应系数分别为a1, a2,  ¼¼,aN。误差E定义如下:


      

    欲使误差E最小,可令  由此可得一方程组,矩阵表示如下:
 

如果基函数j1,j2,¼¼,jN是标准正交基函数,即
 
则由上面的方程组可解得:
 

    在一N维子空间中,从一组线性独立的初始基函数总可以通过施密特正交化方法得到一组标准正交基函数[11 12],主要构造原理[13]如下:
    设U为某一区域内所有点(x,y)的集合,在U上两个函数的内积定义为: 

 

4 实验结果及讨论

本文采用两幅128´128,8bit Test和Lena图像作为实验图像,如图1所示:

    本文采用两种方法重建图像,第一种方法是基于PCNN的不规则分割区域压缩编码(下文简称算法1),第二种方法是将原图像分成8´8的块,然后对各块进行DCT变换,最后按Z字型保留6个变换系数用于重建图像(下文简称算法2)。为了便于进行比较,无论采用何种方法,最终得到的各重建参数都不进行进一步编码,都用8bit表示,另外我们将各方法的压缩比大致调为相同,然后比较各方法的峰值信噪比(PSNR)及重建图像的主观视觉效果。
对于纹理比较简单的图像,如Test图像,PCNN可以实现图像的完整分割,也就是说它可以完全按照图像的边界将原始图像分割为不同的区域,然后用正交基近似各个不规则的区域,从而实现很高的压缩比。各种方法的重建图像如图2所示,在压缩比近似的情况下,两种算法的峰值信噪比PSNR如表1所示,其中PSNR的定义如下所示:
 
    其中(i,j)代表像素点坐标,I(I,j)和I’(I,j)分别表示原始图像和重建原图像各像素点灰度值,M、N表示图像的行列数。

    从试验结果和重建图像的质量上可以看出,算法1在恢复图像的信噪比及主观视觉效果上均好于算法2。在压缩比接近的情况下,前者的峰值信噪比均高于后者;在主观视觉效果上,图像a明显要好于图像b,图像a清晰自然,细节丰富。
    通过多次试验发现正交基的个数(这里设为N)N只能取1,3,6,10,15,21,28 ……。表1和图2的结果都是在N=6的情况下得到的。事实上,基于不规则分割区域的压缩编码的一大优势是:压缩率是可以被控制的[10]。本文重点在于阐述PCNN作为分割策略的有效性,没有考虑省略重建系数。图3是对应不同N值重建效果的比较,其中,(a)是原图,(b)是对应原图的PCNN网络不同时间的激发情况,算法1把原图分成了210块子图像。(c)-(f)分别是N=3、6、10、15对应的重建图像。从图3中可以看出随着N值的增加,重建图像的效果逐步变好。但试验证明当N=15、21时PSNR就开始略有下降,从理论上来讲,应该随着N的增大,图像效果将会越来越好,但对于某一个具体图像来说(用一定个数的正交基上的投影来重建图像已经足够),过大的N会使分割块在阶次较高的正交基上的投影为零,同时因为计算机计算误差的存在,使得这些为零的正交基在重建图像时系数并不为零,从而造成重建图像有明显失真和误差存在(如图3中(f)、(g)),造成PSNR略有下降。


    本文重点在于说明基于PCNN不规则分割区域编码方案的正确性和合理性,特别是PCNN符合了人类视觉系统的特性,完全依赖于图像的自然属性对图像进行分割,不用预先选择处理的空间范围。这是PCNN应用于图像处理的优势[ 14,15 ]。

5 小结

    由于PCNN本身对图像细节又较好的保留特性[16],在图像变模糊之后,仍能达到很好的分割效果。PCNN优秀的分割特性再一次成功地应用于本算法的编码方案中,尤其是在保持图像细节方面,有着传统块编码无法比拟的优势。从图3的结果来看,分割的区域的内部重建的效果还不是很理想,作为一种成熟的编码方案,这是还需要完善之处。

参 考 文 献


[1]ISO/IEC 10918-1, Information technology-digital compression and coding of continuous-tone still images-part 1: Requirements and guidelines[M], 1994.
[2]ITU-T Recommendation H.261, Line transmission of non-telephone signals. Video codec for audio visual services at P*64kbit/s[M], March 1993.
[3]ISO/IEC 11172-2, Information technology-coding of moving pictures and associated audio for digital storage media at up to about 1.5mbit/s-part 2: Video[M], Augur 1993.
[4]SO/IEC 13818-2, Information technology-generic coding of moving pictures and associated audio information-part 2: Video[M], March 1994.
[5]M.Kunt, A.Ikonomopoulos, M.Kocher, Second generation image coding techniques[J], Proc IEEE, 73(4): 549-575, 1985.
[6]M.Kunt, et al. Recent results in high compression image coding[A]. IEEE Trans on CAS,34(11):1306-1336,1987.
[7]M. Gilge, Region-oriented transform coding(ROTC) of images。 I[n]: Proceedings of the International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Albuquerque, April 1990, 2245-2248.
[8]J.L. Walsh, Interpolation and Approximation by Rational Functions in the Complex Domain[J], American Math. Soc. Colloq. Publ., vol.20, American Math. Soc., Providence, 1965.
[9]马义德,李廉,戴若兰,一种基于脉冲耦合神经网络和图像熵的自动图像分割方法[J] ,通信学报,2002 29(3):49-51
[10]马义德,李廉,戴若兰,一种基于脉冲耦合神经网络的植物胚胎细胞图像的分割研究[J]科学通报,2001 46(21):1781-1787
[11]W. Philips. A Fast Algorithm for Orthogonalizing Polynomials on an Arbitrarily Shaped Region[R]. ELIS Technical Report WP 96-01, 1996.
[12]Andr´e Kaup, Til Aach, Coding of Segmented Images Using Shape Independent Basis Functions[A].[In]:IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 7, NO. 7, JULY 1998:937-9
[13]姚天任,孙洪,现代数字信号处理[M],华中科技大学出版社,中国武汉,1999年6月
[14]顾晓东,余道衡,PCNN的原理及其应用[J],电路与系统学报,2001(6)3:45-51
[15]1Ma Yi-de,Shi  Fei, Li Lian,A NEW KIND OF IMPULSE NOISE FILTER BASED ON PCNN[A],IEEE ICNNS P2003
[16]马义德,吴承虎,基于PCNN脉冲耦合神经网络的有噪图像特征提取[A],2002 CNNC:661-667