- 06/12
- 2019
-
QQ扫一扫
-
Vision小助手
(CMVU)
摘 要:针对比特位平面提升算法的缺陷,提出了失真-长度斜率提升隐式感兴趣区域编码算法。该算法在组织码流时通过对感兴趣区域对应的失真-长度斜率进行提升得以实现,当对感兴趣区域要求有所改变时,只需重新调整失真-长度斜率并重新组织码流即可。相对于位平面提升算法,简化了算法的复杂度。具有提升的取值范围灵活,适合给定感兴趣区域重建指标和交互式图象编码的特点。
关键词:感兴趣区域编码;失真-长度斜率提升;比特位平面提升
Implicit Region of Interest Coding Based on Distortion-length Slope Lifting
Abstract: Aim at the limitation of the method of bitplane lifting, implicit Region of Interest Coding Based on Distortionlength Slope Lifting is proposed. This method is based on distortionlength slope lifting to implement ROI coding. It only needs to adjust the distortionlength slope and organize the code stream when ROI is changed. It simplify the complexity of the algorithm comparing with the method of bitplane lifting. It is characteristic of lifting range easy to set and being suitable for image compression with the given ROI PSNR and interactive applications.
Keywords: ROI coding; distortion-length slope lifting; bit-plane lifting
1 引 言
感兴趣区域(ROI)编码处理是新一代静止图像压缩标准JPEG2000中提供的一种新特性,作为图像编码研究的对象之一,它可以将用户感兴趣的图像区域(ROI)与背景区域(BG)区别开来,对感兴趣区域采用低压缩比的有损压缩甚至无损压缩,而对背景区域则采用高压缩比的有损压缩,可以解决压缩比和重建图像质量的矛盾,并实现对ROI的优先、优质的编码操作。
在基于小波的图像压缩中,一般是通过比特位平面提升来实现ROI编码的[1,2]。JPEG2000中采用了两种算法:Scaling Based方法和Maxshift方法。Scaling Based方法允许用户自己定义ROI区域系数上移位平面数S,实现对ROI编码效果的灵活控制,但必须将掩码图像信息写入码流;Maxshift方法可以看作是Scaling Based方法的特殊情况,移位后所有与ROI有关的位平面都高于与BG有关的位平面,这样就可以实现ROI和BG区域数据的完全分离,因而不必将掩码图像信息写入码流。Scaling Based方法中的S必须是整数,当S增加或减少1时恢复图像峰值信噪比的变化大。Maxshift方法主要缺陷是不能控制ROI和BG的相对质量,同时由于是完全提升,因此对编解码器的要求较高[3,4]。
JPEG2000的核心算法是EBCOT(优化截断嵌入块编码)。研究表明,通过调节驱动构造质量层的代价函数可以实现ROI编码,称这种方法为隐式ROI编码,因为在码流中没有明确的信息表示编码器已经对图像的任何区域区别对待[5]。利用EBCOT的特点[6],本文通过在码流组织时对感兴趣区域失真-长度斜率进行提升,实现了隐式ROI编码,该方法不对小波系数进行比特位平面提升,也不需对其进行逆提升,同样能得到很好的ROI编码效果。
2 基于率失真优化的编码顺序
如图1所示实线代表了传统的编码顺序,虚线代表了基于率失真优化的编码顺序。传统的编码中,符号是按进入编码器的顺序被编码的,虽然在最终的目标码率时,达到了目标失真,但是并不能使得每编码一个符号,都可以达到最大的失真减少。而基于率失真优化的编码,不但考虑了最终码率时的失真问题,同时也考虑了每一符号被编码时的失真问题。编码是按照率失真斜率(Rate Distortion Slope)递减的顺序开始的。即具有最陡率失真斜率的符号先编码,每编码一个符号,都能得到最大的失真减小。
图1 基于率失真优化的编码顺序
从率失真斜率的角度考虑了位分配问题,能使得最先被分配的那些位具有最陡的率失真斜率,这样算法每编码一位,都有最大的失真减少,并且编解码路径完全一致。编解码可在任意截断点被终止,实现目标码率和失真。调节码率仅仅只是在确定的截断点截断位流,实现精确的位率控制。算法可在低码率的条件下很好的重建图像。
3 压缩后率失真优化算法(PCRD-opt)的优化
定义一个量“失真-长度斜率(distortion-length slope)” 如下:
EBCOT中优先截断采用的是PCRD-opt算法[6]。它可以用于优化码块截断点集合 ,使得在总体长度 的约束下,总体失真D最小。其原理如下:
4 失真-长度斜率提升的感兴趣区域编码
EBCOT编码器是由Tier-1和Tier-2编码器组成。Tier-1编码器把各个子带分割为64*64或32*32 的码块,并对各码块进行比特位平面独立编码,每个比特位平面编码分为3个步骤,即“重要性演化通道”、“幅值细化通道”和“清除通道”,同时计算每步骤的失真-长度斜率参数。Tier-2编码器根据这些参数,利用失真-长度斜率优化截取算法组织码流,从而使恢复图像的失真最小。
本文提出的失真-长度斜率提升的隐式感兴趣区域编码算法流程如图:
5 算法的测试结果及分析
本文结合Kakadu软件,对Maxshift方法和本文的隐式ROI编码进行了测试,感兴趣区域的范围为标准Lena原始图像中心部位四分之一大小的区域。表1是两种方法在四种码率下的测试结果的对比统计数据,图3为由Maxshift算法和本文隐式ROI算法得到的感兴趣区域(ROI)、背景区域(BG)和整幅图像的PSNR随码率的变化曲线。
表1 Lena图像的试验测试数据(CPU:Celeron(R) 2.4GHz+Kakadu软件)
图3 恢复图像PSNR随码率变化曲线
实验结果表明,采用本文的隐式ROI编码所得到的背景区域和整体图像的PSNR在低比特率情况下要远大于Maxshift方法,在码率较大时的编码速度要好于Maxshift方法,本文方法所得到的图像不仅能得到ROI区域的优质优先编码,在保持ROI的PSNR要求同时背景的PSNR下降较小,同时也能得到ROI与BG区域的相对质量的有效控制,图像整体质量更好。
6 结 论
从本文的算法原理和实验结果中可以表明隐式ROI编码——失真-长度斜率提升的感兴趣区域编码具有以下优点:
(1)该方法避开了对小波系数的比特位平面提升及其逆提升,节省了编解码时间。
(2)感兴趣区域不需要给出相对背景的绝对优先级,有利于ROI与BG区域的相对质量的控制。
(3)失真-长度斜率提升不受比特位平面限制,形式更加自由,提升范围更加灵活。
(4)对交互式图像编码改变ROI的质量要求时,本文算法只要进行一次T1编码,避免了比特位平面提升的多次编码的缺陷。
但是,这种隐式ROI编码也有其缺陷:调整只能逐块进行,因此阻止了视觉掩蔽优化。隐式感兴趣区域编码机制克服了比特位平面提升ROI编码方法的不足,具有广泛的使用价值。
参 考 文 献
[1]Liu Lijie, Fan Guoliang. A new JPEG2000 region-of-interest image coding method: Partial significant bitplanes shift [J]. IEEE Signal Processing lett,2003,10(2):35~38
[2] Wang Zhou, Bovik Alan C. Bitplane-by- bitplane shift(BbBShift)-A suggestion for JPEG2000 region of interest image coding[J]. IEEE Signal Processing Lett, 2002, 9(5):160~162
[3] ISO/IEC JTC 1/SC 29/WG1ITU-T SG8).ISO/IEC FCD 15444-1:JPEG2000 Part I Final Committee Draft Version 1.0[S].
[4] ISO/IEC JTC 1/SC 29/WG1
ITU-T SG8).ISO/IEC FCD 15444-2:JPEG2000 Part II Final Committee Draft [S].
[5]魏江力,柏正尧等译,[美]David S. Taubman, Michael W.Marcellin. JPEG2000图像压缩基础、标准和实践.北京:电子工业出版社,2004
[6D. Taubman. High performance scalable image compression with EBCOT. IEEE Trans. Image Processing, 2000, 9(7):1158~1170
[7]邓家先,吴成柯,李云松等.率失真斜率提升感兴趣区域编码.西安电子科技大学学报,2004,31(2):205~208