- 01/19
- 2006
-
QQ扫一扫
-
Vision小助手
(CMVU)
针对边缘匹配嵌入法的密写分析以及嵌入率估计
王威娜 张新鹏 王朔中
(上海大学通信与信息工程学院,上海200072)
摘 要: 一种有代表性的密写方法是根据像素间相关性来进行秘密信息的嵌入,例如基于相邻像素差值的边缘匹配(SM)密写法。本文指出SM密写会引起像素灰度差值直方图统计特性的异常,这一性质提供了检测秘密信息存在性和估计嵌入信息量的线索,由此提出一种有效的SM密写分析法。以嵌入率a为参数对密写图像像素灰度差值直方图进行分段拟合,通过寻找全局最佳拟合实现密写分析并估计嵌入率,具有实现简单、计算量小的优点。实验表明该方法的有效性。
关键词:密写;密写分析;边缘匹配;灰度差值
Abstract:A typical steganographic technique such as the side match (SM) approach makes use of correlation between neighboring pixels. It is shown in this paper that SM, which inserts secret data in neighboring pixel-value differences, inevitably causes abnormality in the pixel-value difference histogram. This provides a clue for staganalysis. A new method is thus proposed to analyze SM steganography and estimate the payload. An assumed embedding rate a is used to calculate a set of local histograms in sections of difference values by means of curve fitting. A globally optimal histogram fitting is then obtained by adjusting the a value to achieve a smooth overall histogram. The algorithm can be easily implemented. Experimental results show the effectiveness of the proposed technique.
key words:steganography; steganalysis; side match (SM); pixel-value difference
1 引言
密写(steganography)[1-4]是信息隐藏的一个重要分支,即以图象、音频等数字媒体作为掩护,把要发送的秘密消息嵌入到载体信号内部,以不引起外界注意的方式通过公共信道特别是互联网进行传递。对密写的攻击可分为密写分析(steganalysis)和主动攻击。密写分析通过统计方法检测数字媒体中秘密信息的存在性,这是目前针对密写的主要对抗措施;而主动攻击是指在不影响视、听觉质量的情况下,对数字媒体进行某种干扰,使得嵌入的秘密信息无法被接收方提取。近年来,由于信息安全意识的提高,特别是“9.11”以来,人们越来越关注如何察觉、控制敌对隐蔽通信的问题,学术界也在反密写方面进行着不断深入的研究。
边缘匹配(side match, SM)密写法是一种利用像素间灰度差值进行密写的方法。通过相邻像素间的相关性来估计像素间是平滑的还是起伏剧烈的,在平滑区嵌入量少,而在起伏剧烈区则嵌入量大。其最大的优越性是能够嵌入较多的秘密信息,并且视觉失真小。
本文基于统计特性提出一种针对SM密写的分析方法。根据检测密写后像素灰度差值直方图的统计特性来判断秘密信息是否存在,并以嵌入率α为参数对其直方图进行曲线拟合,通过寻找最佳全局拟合来估计嵌入率。这种方法计算量小,能较为准确地估计隐蔽数据的嵌入率。
2 SM密写
SM密写法[5]首先计算像素间的差值,以此确定可嵌入信息量的多少。如果差值小,表示是平滑区域,嵌入的信息量就少;反之则认为是起伏剧烈区域,可嵌入较多的秘密信息。可分别根据2、3、4个相邻象素定义差值,随后通过对差值的修改完成对秘密信息的嵌入。
以基于2个相邻像素的数据嵌入为例。保持第1行和第1列像素灰度值不变,从第2行第2列的像素开始进行逐行逐列的扫描,取位于当前像素上方和左方的像素计算差值。设被修改的当前像素Px的灰度为gx,其上方和左方的像素Pu,Pl的灰度值分别记为gu,gl,按照下列规则依次进行差值计算和数据嵌入。
像素灰度差值d定义为
(1)
如果d等于-1,0,+1,则按照LSB法[4]将待嵌二进制秘密信息写入差值d中,可获得一个新的差值d'。如果不是,则先通过差值d来计算可嵌入的比特数n:
(2)
接着截取n位待嵌二进制秘密信息,并将其转换为十进制数b (b = 0, 1, 2, … , 2n-1)。然后把b嵌入到差值d中,获得一个新的差值d':
(3)
最后由新的差值d' 求得被嵌像素点Px的含密灰度值为:
(4)
从边缘匹配密写法得到的含密图像中提取秘密信息的过程很简单:按上述同样的规则对图像进行扫描,得到2点间像素灰度差值d*:
(5)
如果得到的d*值为-1,0,+1,则按LSB法对d*进行提取;如果不是,则先通过d*计算嵌入了多少比特秘密信息,设嵌入比特数为
(6)
由于bÎ[0, 2n-1],根据公式(3)可看出提取比特数n*与嵌入比特数n一样。然后根据式(7)得到所嵌入信息对应的十进制数b:
(7)
最后根据b恢复出原始的二进制秘密信息。
3 对SM密写法的检测
早些时候提出的PVD密写法利用相邻像素的差值进行信息嵌入[6],我们对PVD密写已经提出了有效的分析方法[7]。虽然SM密写也是将秘密信息嵌入到像素灰度差值中,其差值的定义以及对所得差值d的划分方法与PVD有所不同,但SM密写会改变像素间差值的统计特性,使我们也能利用差值直方图对其进行检测。
图1 标准测试图像Lena的2邻点差值直方图h(d)
Figure 1 Difference histogram of the original host image Lena when the two-sided method is used
根据SM法采用的邻近2点像素差值计算法可得到不含密原始图像差值d(dÎ[-255, 255])的直方图h(d)。不含隐蔽信息的自然图像通常具有平滑的差值直方图,如图1给出了原始测试图像Lena(512Í512)的差值直方图,随着d的增大h(d) 平滑而迅速地减小。
(a)
(b)
图2 含密图像Lena的2邻点差值直方图h'(d)
Figure 2 Difference histogram of the stego-Lena using the two-sided method
不考虑d为-1、0、+1时由LSB法嵌入的特殊情况。根据式(2),在8bit灰度图像中可嵌入的比特数n取值范围为1~7。由式(3),将具有相同因子2 n的差值|d|作为一个区间,可得到7个区间[2,3]、[4,7]、[8,15]、[16,31]、[32,63]、[64,127]、[128,255],每个区间共有2n个相应于待嵌秘密信息的十进制数值b。由于秘密信息在嵌入前通常经过加密处理,可以看作是0、1均匀分布的随机码流,因此可认为在每个区间里各种b值出现的概率相等。图2是由2邻点SM法得到的512Í512标准测试图像Lena的含密h'(d) ,其嵌入率a分别为:(a)54%,(b)98%。在 [3,4]、[7,8]、[15,16]、[31,32]、[63,64]、[127,128]之间出现的阶梯效应清楚地表明了秘密信息的存在,而且嵌入率a越大,各级阶梯就越平坦,阶梯效应越明显。
4 SM密写法嵌入率的估计
基于直方图阶梯,[7]提出了对PVD密写的分析和信息量估计法。现在我们给出一种新的更为简单准确的嵌入率估计方法。由含密图像的h'(d)和嵌入率a的估计值a' 可得到不含密图像的h(d)。[uk, lk] (k = 1, 2, … , 7) 表示划分的7个区间,将每个区间中的h(d)值进行曲线拟合,计算相邻区间的拟合曲线在衔接处的误差值e。改变对嵌入率a的估计以寻求最小总误差E,得到的a' 就是嵌入率的最佳估计。
具体方法如下。不考虑d为-1、0、+1时由LSB法嵌入的特殊情况,各区间[uk, lk] (k = 1, 2, … , 7) 的h(d)和h'(d)之间有下列关系:
(8)
可以认为直方图是对称的,因此只需分析正半边的情况。虽然密写会引起原图像灰度差值直方图各点值的改变,但在同一区间[uk, lk] (k = 1, 2, … , 7) 内总和保持不变,即:
(9)
因此式(8)可改写成:
(10)
可见,由含密图像的h'(d)和任一嵌入率估计值a' 可以得到h(d)的一个估计。在每个区间[uk, lk] (k = 1, 2, … , 7) 内由h(uk), h(uk+1), … , h(lk-1), h(lk)得到一条拟合曲线Ck,7个区间共可得到7条不同的拟合曲线Ck,k = 1, 2, … , 7。计算各段拟合曲线在相邻区间结合处中点的取值,例如区间1和2之间的中点为3.5,区间2和3之间的中点为7.5。于是得到C1(3.5), C2(3.5), C2(7.5), C3(7.5), … , C6(127.5), C7(127.5)。相邻区间中点两侧的拟合曲线的误差值为e,
(11)
总误差为
(12)
由不同的估计值a' 可得到不同的误差值E,E越接近0则所估计的嵌入率a' 越准确。
5 实验验证
以大小为512Í512、灰度值为8bit的标准测试图像Lena、Man、Milkdrop、Elaine作为载体进行实验,在嵌入率a分别为100%、75%、50%和25%情况下所得到的估计值a' 如表1。
再用10幅大小为512Í512、灰度值为8bit的标准测试图像,以及90幅用数字照相机采集的含风景和人物,大小也为512Í512、灰度值为8bit的图像进行实验(拍摄时图像均用非压缩格式保存)。在嵌入率分别为75%、50%、25%的情况下对a进行估计,实验结果如图3所示,其中横坐标为图像编号n,纵坐标为嵌入率a的估计值a'。
图3 对100幅图像进行嵌入率估计的实验结果
Figure 3 Results of estimated a' of 100 stego-images
分别计算图3中三组数据的方差,结果如表2所示。可见对嵌入率的估计精度随嵌入数据量的不同有所变化,但并不敏感。总体上嵌入率大时估计值的方差较小。
6 结束语
本文通过分析边缘匹配SM密写法引起像素差值直方图的变化提出一种简单易行的密写分析和嵌入率估计法,这一方法能较准确地估计出密写嵌入率。对大量图像在不同嵌入量的情况下所得到的实验结果验证了所提出方法的有效性。除了少数图像之外,误差范围一般不超过10%。总的来说嵌入量越大对嵌入率的估计越准确。实验中采用的都是未经压缩的8bit灰度图像。本文提出的嵌入率估计法经过适当修改也可分析基于3、4个相邻象素差值的同类密写方法。在此基础上将进一步研究针对任意差值计算法的密写分析技术。
参 考 文 献
[1] Petitcolas F A P, Anderson R J, and Kuhn M G, Information Hiding ¾ A Survey [J], Proc. IEEE, 1999, 87, pp.1062-1078.
[2] Provos, N, and Honeyman, P, Hide and Seek: an Introduction to Steganography, IEEE Security and Privacy Magazine, 1(3), May-June 2003: 32-44.
[3] Fridrich J, and Goljan M, Practical Steganalysis of Digital Images ¾ State of the Art. In: Security and Watermarking of Multimedia Contents IV, Proceedings of the SPIE, 4675, San Jose, USA, Jan. 2002: 1-13.
[4] 王朔中,张新鹏,张开文,数字密写和密写分析 ¾ 互联网时代的信息战技术,清华大学出版社,北京,2005,ISBN 7-302-10285-6.
[5] Chang C C, and Tseng H W, A Steganographic Method for Digital Images Using Side Match, Pattern Recognition Letters, 25, 2004: 1431-1437.
[6] Wu D C, and Tsai W H, A Steganographic Method for Images by Pixel-Value Differencing, Pattern Recognition Letters, 24, 2003: 1613-1626.
[7] Zhang X, and Wang S, Vulnerability of Pixel-Value Differencing Steganography to Histogram Analysis and Modification for Enhanced Security, Pattern Recognition Letters, 25, 2004: 331-339.
基金项目: 国家自然科学基金( 60372090)、上海市科委基础研究重点项目( 04JC14037)
第一作者简介: 王威娜(1981-),女,硕士研究生。主要研究领域:信息隐藏。
版权所有,任何个人和机构都不允许以任何形式转载,否则将追究法律责任,谢谢!