小波变换的计算机生成图像与自然图像的检测方法 【技术领域】
本发明涉及的是一种图像检测技术领域的方法,具体是一种小波变换的计算机生成图像与自然图像的检测方法。
背景技术
计算机生成图像的出现已经成为当前数字图像取证可信度的严重障碍,由于人眼视觉系统的特性或图像取证技术人员业务知识的有限性,高仿真的计算机生成图像很容易被认为是真实的数字图像而被用作图像取证。在计算机生成图像的检测中,最关键的问题在于如何准确地区分计算机生成图像与自然图像之间的特征差别。因此,特征提取是解决计算机生成图像与自然图像检测的首要问题。通常的特征提取都是采用单一类型的特征信息,信息涵盖不全,分析能力不强,收集到的特征信息不能够十分准确地用于计算机生成图像和自然图像的检测。比如,目前基于离散小波变换的统计特征提取技术、特征阀值判决技术等都没有包含足够全面的特征信息,以致于自动检测的准确率不高。
经对现有技术文献的检索发现,Wen Chen,Yun Q.Shi和Guorong Xuan在文献“Identifying computer graphics using HSV color model and statisticalmoments of characteristic functions”(《基于HSV色彩模型和特征函数统计矩的计算机图像鉴定》)(Multimedia and Expo,2007 IEEE InternationalConference.USA:IEEE,2007.1123-1126)(多媒体博览会,2007 IEEE国际会议),提出了基于HSV色彩模型的检测方法,并通过分类器来判断图像真伪,但是检测准确率不高,仅有82.1%。而Ying Wang和Pierre Moulin在文献“OnDiscrimination Between Photorealistic and Photographic Images”(《类自然图像和自然图像的鉴定》)(Acoustics,Speech and Signal Processing,2006.ICASSP.IEEE International Conference)(声学、语言和信号处理,2006 ICASSP国际会议),提出了通过滤波得到两个高频特征和一个低频特征来进行检测的新方法,检测准确率虽然有所提高,可以达到90.2%,但是仍不能满足实际应用需求。
为更有效地进行计算机生成图像和自然图像的检测,应对同一幅图像提取多方面特征,以得到足够全面、有效的特征信息。
【发明内容】
本发明目的在于针对现有技术的不足,提供一种小波变换的计算机生成图像与自然图像的检测方法,使其通过离散小波变换、提取并结合高频滤波,进而提高数字图像防伪的计算机生成图像与自然图像的检测准确率,为图像取证等相关领域提供可靠的依据。
本发明是通过以下技术方案实现的:
本发明包括步骤如下:
首先,对待测图像进行色彩通道转换,将RGB(Red-Green-Blue:红-绿-蓝)彩色图像转化为HSV(Hue-Saturation-Value:色彩信息-饱和度-明亮度)彩色图像;
然后,经过对图像各通道进行变换,进而获得一个包含统计矩特征和高频滤波特征的多维特征向量;
进一步利用计算机生成图像与自然图像的特征的差别进行特征提取;
最后通过支持向量机SVM判别,迅速地判断出其真实性,进而检测一幅图像是计算机生成图像还是自然图像。
所述的图像色彩通道转换,具体步骤为:首先对RGB图像中的R、G、B分量进行归一化处理,即将R、G、B分量分别除以255,于是R、G、B分量由整型数据变为在区间[0,1]中的浮点型数据;然后,得到图像的HSV色彩通道模型:
H=H+360 H<0
S=δMAXMAX≠00MAX=0]]>
V=MAX
其中,δ=(MAX-MIN),MAX=max(R,G,B),MIN=min(R,G,B)。
所述的进行特征提取,通过将待检测图像的每个通道进行3阶DWT、直方图计算、DFT并取模,进而通过计算求得一个包含统计矩特征和高频滤波特征的多维特征向量,公式如下:
Mk=Σm=1Nmk|H(m)|/Σm=1N|H(m)|,k=1,2,3]]>
M′=Σm=0N/4|H(m)|sin(4πm/N)]]>
其中,H(m)(m=1,2,...,N-1)是直方图h(n)(n=1,2,...,N-1)对应的DFT变换,N为直方图的子区间数,Mk(k=1,2,3)为H(m)的k阶统计矩特征,M′为H(m)的高频滤波特征。
具体步骤为:
①首先,分别对图像的H、S、V通道进行3阶DWT变换,变换后每个通道都可得到13个子带(3次小波变换可得到12个子带,并将原通道也作为一个子带),整幅图像可得到39个子带;
②其次,对每个子带分别进行直方图计算。由于图像的直方图是连续的,故可以将区间[0,1]等分为N(例如取N=100)等份,然后再通过统计每段子区间的像素数来计算直方图。
其中,i=0,1,...,N-1(N为所分的子区间段数);
③然后,对表示各直方图的N点空间域离散序列h(n)(n=1,2,...,N-1)进行DFT变换,得到相应的N点频域离散序列H(m)(m=1,2,...,N-1),并对该序列取其模|H(m)|;
④最后,对每个子带,通过与其相应的|H(m)|提取统计矩特征和高频滤波特征:
Mk=Σm=1Nmk|H(m)|/Σm=1N|H(m)|,k=1,2,3]]>
M′=Σm=0N/4|H(m)|sin(4πm/N)]]>
其中,Mk(k=1,2,3)为H(m)的k阶统计矩特征,M′为H(m)的高频滤波特征。
由于每幅彩色图像都有3个通道,而每个通道都可得到13个子带(3次小波变换可得到12个子带,并将原图也作为一个子带),每个子带又可得到4个特征(分别为M1、M2、M3、M′),于是,每幅图像都可以得到一个156维的特征向量。
所述的变换,是指:离散小波变换、直方图计算、离散傅里叶变换,变换操作之后地序列中提取出来的特征信息包括1、2、3阶统计矩特征信息Mk(k=1,2,3)以及经过高频滤波后所得到的高频特征信息M′,可以提供全面的图像检测信息,在图像的场景变化时,能够不受影响地检测出图像的准确类型,进而获得极高的计算机生成图像与自然图像的检测准确率。
所述的通过支持向量机SVM判别,包括如下步骤:
①用一些已知类别的图像构成训练集(包括计算机生成图像和自然图像),对训练集的每一幅图像提取上述的多维特征向量,并用不同的标志位来标志其图像所属类别(如标志位1表示自然图像,标志位-1表示计算机生成图像);
②通过LibSVM对选定的训练图像库中的图像进行训练,以获得可以达到最佳检测效果的参数,进而得到一个基于上述参数的模板文件。
③对测试图像提取上述基于DWT的多维特征向量,并用②中得到的最佳检测准确率所对应的模板文件进行比较,判断其所属类别。
本发明基于小波变换,采用统计矩特征和高频滤波特征相结合的技术,具有高准确率、特征提取全面、全图检测等特点,很好地解决了计算机生成图像与自然图像的检测问题,可以满足图像取证的需求。采用更接近于人眼视觉系统的HSV色彩通道模型,能够可靠地提取出可以区别计算机生成图像和自然图像的特征,进而大大地提高了检测准确率。
【附图说明】
图1为本发明流程图;
图2为本发明基于小波变换的特征提取流程图。
【具体实施方式】
下面结合附图对本发明的实施例作详细说明:本实施例采用的图像库中的计算机生成(CG)图像来源于哥伦比亚大学的CG图像库以及互联网上的一些逼真的CG图像,共594幅;自然图像来源于个人数码相机拍摄,共594幅。本实施例在上述图像库下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
基于图像小波变换的特征统计矩及高频特征的分析,关于自然图像和计算机生成图像的统计信息出现明显不同,通过特征提取后,经过SVM分类器进行分类,可迅速地判断出其真实性。具体过程为:
第一步:随机选取计算机生成图像、自然图像各500幅组成训练集,其余图片组成测试集:将594幅计算机生成图像编号为1至594,利用随机函数,产生一组1~594之间的随机数,将图片按照随机数的编号重新排列,取前500幅作为训练集部分,剩余作为测试集部分;同理,在自然图像集上进行类似的操作,可以建立起训练图像集和测试图像集;
第二步:对训练图像集的图像进行基于DWT的特征提取:
①对图像进行色彩通道转化;
②分别对图像的H、S、V通道进行3阶DWT变换,变换后每个通道都可得到13个子带,整幅图像可得到39个子带;
③对每个子带分别进行直方图计算。由于图像的直方图是连续的,故可以将区间[0,1]等分为N(例如取N=100)等份,然后再通过统计每段子区间的像素数来计算直方图。
其中,i=0,1,...,N-1(N为所分的子区间段数);
④对表示各直方图的N点空间域离散序列h(n)(n=1,2,...,N-1)进行DFT变换,得到相应的N点频域离散序列H(m)(m=1,2,...,N-1),并对该序列取其模|H(m)|;
⑤对每个子带通过与其相应的|H(m)|提取统计矩特征和高频滤波特征:
Mk=Σm=1Nmk|H(m)|/Σm=1N|H(m)|,k=1,2,3]]>
M′=Σm=0N/4|H(m)|sin(4πm/N)]]>
其中,Mk(k=1,2,3)为H(m)的k阶统计矩特征,M′为H(m)的高频滤波特征。
由于每幅彩色图像都有3个通道,而每个通道都可得到13个子带(如①所述),每个子带又可得到4个特征(分别为M1、M2、M3、M′,如④所述),于是,每幅图像都可以得到一个156维的特征向量;
第三步:利用LibSVM进行训练及测试:
①对得到的训练集图像多维特征向量,用不同的标志位来标志其图像所属类别(1表示自然图像,-1表示计算机生成图像);
②通过LibSVM对选定的训练图像库中的图像进行训练,以获得可以达到最佳检测效果的参数,进而得到一个基于上述参数的模板文件。
第四步:利用训练过的LibSVM模版文件进行图像所属类别的判定。与训练图像集的特征提取方式类似,提取测试图像集中每一幅图像的特征,通过训练过的分类器模板文件可判断其所属类别。将判定结果与测试图像实际所属类别比较,统计判定结果的正确率达到95.3%。
从DWT、直方图计算、DFT操作之后的序列中提取出来的特征信息包括1、2、3阶统计矩特征信息Mk(k=1,2,3)以及经过高频滤波后所得到的高频特征信息M′,可以提供全面的图像检测信息,在图像的场景变化时,能够不受影响地检测出图像的准确类型,进而获得极高的计算机生成图像与自然图像的检测准确率。
本实施例在特征提取时综合了统计矩特征和高频滤波特征,在基于离散小波变换的计算机生成图像与自然图像的图像检测领域中尚属首创,可以大大地提高检测准确率。实验表明,该方法的检测准确率很高,可以满足图像取证等图像检测领域的需求。