首页>论文>正文
日期
07/23
2012
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

一种用于版权保护的文档图像双水印算法
收藏
2012-07-23 14:51:48来源: 王婷 王希常 刘江

1.引言
    随着计算机网络和多媒体信息处理技术的发展,文档资料的数字化和网络化是信息时代的发展趋势。为了有效地发挥文档资料的作用,必须运用信息技术实现资源开放和共享,通过各种渠道将数字化文档在不同范围内分发,有偿或无偿提供资料的使用权,或在Internet上公开发布。但因为数字化资料可方便地进行复制和广泛传播,由此引起的滥用、篡改或伪造,以及版权所有者合法权益被侵犯等问题是不可忽视的。因此,必须采取相应技术措施对破坏和侵权行为进行有效控制,并在发生非法篡改或盗版等情况时能在法律诉讼中提出有力的证据。
    近年来国际上提出了一种有效的数字产品版权保护技术—多媒体数字水印。将这一技术应用于扫描获得的文档图像,对于确保文档资料的合法使用具有十分重要的作用。
    根据水印的可见性,可分为可见水印和不可见水印两类。可见数字水印主要用于明确标识版权,防止非法的使用,虽然可见水印有可能减少图像的使用范围,但却无损于所有者的使用,而且可以减少对版权图像非法拥有的可能性;不可见水印主要用于版权保护、隐含标识、认证及隐蔽通信等方面。
    根据水印的使用目的,可分为鲁棒水印和脆弱水印两类。鲁棒数字水印主要用于在数字作品中标识著作权信息,如作者、作品序号等,它要求嵌入的水印能够经受各种常用的编辑处理;脆弱数字水印主要用于完整性保护,与鲁棒水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印的状态就可以判断数据是否被篡改过。
    与普通图像相比,文档图像的一个显著特点是它主要由文字区域和非文字区域组成,通常文字区域是全黑或近似于全黑,非文字区域是全白或近似于全白,表现在灰度直方图上为灰度值分布两极化,图1即为Lena图像与文档图像的灰度直方图比较,所以仅在文档图像中嵌入可见水印,通过分析灰度直方图便很容易检测并去除,不能达到保护版权的目的。


(a) Lena图像灰度直方图

(b) 文档图像灰度直方图

图1 两种图像灰度直方图比较

    本文提出的双水印算法,以Mohanty的算法 [3]为基础并作了一定的改进,是以自适应可见水印为主、自嵌入不可见水印为辅的体系,达到了既标识版权又认证图像的所有权的目的。自适应可见水印以最鲁棒的方式嵌入,图像剪切、几何变换、锐化、对比度增强以及颜色校正等,这些图像操作不会对可见水印有严重的影响,但是它不抗图像涂改和置换操作,此时可以借助不可见脆弱水印来验证其真实性。根据鲁棒水印优先嵌入原则[4],本算法先嵌入可见水印,然后嵌入不可见水印。
2.算法描述
2.1可见水印的嵌入
   
可见水印的特性和与其相对应的要求大致有以下几点[2]:
    (1) 无论是在彩色或灰度图像上,可见水印均应很容易看见。此外,水印应该覆盖图像的大部分区域,并且应在所覆盖的区域上可见。
    (2) 水印必须在所覆盖的区域上半透明可见,不能破坏所覆盖区域的图像细节。除此之外,水印的嵌入程度应随主图像局部特征的变化而变化。换句话说,应该使水印足够突出地显示以阻止非法使用,同时又应该使水印不太过分刺眼以支持用于学术目的的图像研究。
    (3) 水印必须很难去掉,至少必须达到去掉水印比购买使用图像的版权更加昂贵和费力。这就要求水印能够抵御自动和系统的水印移除。
    (4) 插入水印应该省时省力,不需要太多的人工干预。
根据Mohanty提出的基于频域的可见水印技术[5],本文在对文档图像的特性进行分析后,提出了一个基于图像纹理特征的文档图像自适应可见水印嵌入方案,实现了对Mohanty方法的改进。
    算法采用线性加法嵌入准则,公式为:

    (1)

    其中分别为比例因子和嵌入因子,其系数与块n相对应,是原图像块的DCT系数,是待嵌入水印图像块的DCT系数。
    在选择比例因子和嵌入因子的时候,为避免图像重要信息发生失真,边界块应改变最小,所以只能将极少量的水印灰度值加到原图像的边界块上,也就是说,边界块对应的比例因子应接近于(比例因子的最大值),而嵌入因子应接近于(嵌入因子的最小值)。在边界块检测方法上,文档图像的边缘灰度值过渡比较尖锐,适合用梯度算子检测边界块,本算法采用梯度算子中效果较好的Sobel边缘算子实现。
    当背景有较强的纹理信息时,视觉失真应较小,在一个有较强纹理信息的块中,能量均匀分布于各交流DCT系数中,这就意味着这些块的方差较小,可以加入较多的水印信息。所以方便起见,设成正比,而成反比。在文档图像中,非文字区域是纹理信息较弱的部分,加入的水印信息较少,文字区域是纹理信息较强的部分,可以加入较多水印信息。
    记每个图像块的灰度均值为,整个图像的灰度均值为。由于接近的块对噪声较敏感,所以当时,应随的减小而增大,当时,应随的增大而减小。的变化与的变化趋势相反。
综上,的取值公式定义为:

(2)

  (3)

式中每个图像块规范化平均灰度值为:

(4)

其中的最大值。
图像的规范化平均灰度值为:

(5)

图像块的规范化交流DCT系数为:

(6)

其中, (7)

嵌入步骤如下:
    (1) 将原图和水印图像分为8*8的块(原图和水印可不一样大);
    (2) 计算出原图每个块的DCT系数,从而得到DCT直流系数变量和交流系数变量;
    (3) 利用公式4,计算每个图像块的规范化平均灰度值,利用公式5计算图像的规范化平均灰度值;
    (4) 利用公式7和交流DCT系数,计算规范化方差;
    (5) 利用Sobel边缘算子,确定边界块;
    (6) 利用公式2和3,计算比例因子和嵌入因子,如果是边缘块,比例因子取最大值,嵌入因子取最小值;
    (7) 找出水印图像的DCT块,利用公式1,修改原图像第n个块的DCT系数,逆DCT变换,得到加水印图像。
    对于可见水印来说,不存在水印的提取问题。
2.2自嵌入不可见水印的嵌入与篡改检测
   
自嵌入不可见脆弱水印是将图像本身的特征信息作为水印嵌入,作为一种盲水印技术,它的提取不仅不需要原始图像,而且不需要原始水印,可以实现图像的篡改定位[6]。
    根据Michael提出的基于校验和的自嵌入不可见水印算法[6],本文对其作了一定的改进,将块的索引嵌入其中,使得算法不仅能够定位篡改位置,而且能够正确检测块之间的互换操作。水印的产生和嵌入步骤为[7]:
    (1) 将已加可见水印的图像分成6*6的块,用表示图像块m中第v个像素的值,其中v=1,2...36,m为图像分块总数。
    (2) 计算块内每个像素的高六位的和,,得到校验值,
其中
    (3) 将转换成二进制数,按位随机嵌入块内像素的第二个比特位上,对应的m也转换成二进制数,作为索引值,按位随机嵌入块内像素的第一个比特位上。


图2 嵌入方法示意图

    不可见水印的检测过程与嵌入过程相反。
3.实验结果
    我们对用于网上阅卷的两万份试卷图像进行了测试,结果表明,为保证较好的可见水印嵌入效果,的取值范围为0.95≤≤0.98,的取值范围为0.06≤≤0.16,可见水印通过自适应方式嵌入,可抗剪切、几何变换、锐化、对比度增强及JPEG压缩等操作。不可见水印的嵌入,在对图像进行涂改或置换时,可用来准确定位其篡改位置。
    自适应可见水印和自嵌入不可见水印的嵌入及检测效果如下图,其中图6(a)是在已嵌入双水印的图像中作了两处修改:将“NORMAL”中的“R”和“M”互换位置;将文章里的标点“,”改为“。”。图6(b)用“Ⅹ”表示其篡改部位。


图3 可见水印图像


图4 原始图像


图5 加入双水印后的图像

(a) 篡改图像


(b) 检测篡改部位
图6 图像篡改与检测


4.结论
    本文针对包含文字区域和非文字区域的文档图像,基于视觉模型和文档图像的纹理特性,提出了在频域中自适应地嵌入可见水印信息,并在此基础上嵌入空域不可见水印的双水印算法,达到了既标识又认证文档图像所有权的目的,并且能够精确定位篡改位置。

参考文献
[1] 夏明一等,基于块分类的文档图像水印自适应算法。上海大学学报 Vol.10 No.5,2004, 463-466[2] M. M. Yeung, FC. Mintzer, G.W. Braudaway, and A.R. Rao. Digital watermarking for high-quality imaging. Proc.of IEEE First Workshop on Multimedia Signal Processing, June,1997,357-362
[3] S. P. Mohanty, K.R. Ramakrishnan and M. Kankanhalli. A dual watermarking technique for images. Proc. of The 7th ACM International Multimedia Conference,F lorida,November 1999, 49-51
[4] Mintzer,R.Braudaway,G. W.If one watermark is good, are more better? Proc.of IEEE Int.Conf.on Acoustics, Speech, and Signal Processing. Vol.4,March 1999.2067一2069
[5] Mohanty S P,Ramakrishna K R,Kankanhalli M S. A DCT domain visible watermarking technique for image[A].IEEE International Conference onMultimedia and Expo[C]. 2000,2.1029-1032
[6] J. Fridrich and M. Goljan, Protection of Digital Images using Self em bedding, Symposium Content Security and Data Hiding in Digital Media, Newark, NJ, USA, May 1999.
[7] Michael. J. Sieffert. Methods for detecting tampering in digital images.2000