基于离散余弦变换的音频零水印防噪检测方法 【技术领域】
本发明涉及的是一种图像处理技术领域的方法,具体是一种基于DCT(离散余弦变换)的音频零水印防噪检测方法。
背景技术
随着音频信号处理和互联网的飞速发展,数字音频水印技术已经成为保护数字音像制品版权信息的重要工具。由于人类听觉系统极为灵敏,使得音频水印的研究具有很大的挑战性。根据IFPI(International Federation of the Phonographic Industry)中关于音频水印稳健性的定义,音频水印要具有抵抗各种攻击的能力(鲁棒性),较好的透明性和一定的带宽,即嵌入水印的数据信道带宽至少要有20bps。数字音频水印的鲁棒性,透明性和带宽是三个相互制约的参数,如何增加数字音频水印方法的鲁棒性,并保证良好的透明性和较高的带宽,已经成为数字音频水印技术的一项难点。零水印方法提取音频特性,用水印和该特性生产密钥与传统嵌入式水印相比具有更低的音频损失及更高的保密性。
经过对现有技术的检索发现,温泉,孙锬锋,王树勋在《电子学报》(2003,31(2):214-21)记载了“零水印的概念与应用”,该技术在完全不削减原始音频质量的前提下进行水印的嵌入。该技术仅应用于图像,未能应用于音频。
Y.G.Xiong,and R.D.Wang在international Conference on Cyberworlds(Hangzhou,China:IEEE,2008,11-15)中记载了“An audio zero-watermark algorithm combined DCTwith Zernike moments”(一种结合DCT变换和Zernike矩的音频零水印算法),该技术提出将一部分采样点和同一段的DCT系数结合进行低阶Zernike变换,然后基于Zernike向量生成水印。相比于普通音频水印技术,该技术的复杂度较高。
X.Zhong,X.H.Tang,and H.L.Yue在International Symposium on Microwave,Antenna,Propagation and EMC Technologies for Wireless Communications(Hangzhou,China:IEEE,2007,1227-1230)中记载了“Zero-watermark scheme based on audio’s statisticalcharacter”(基于音频统计特征的零水印算法),该技术利用音频的统计特征和一维信号近似分量的均值来产生水印。但在实际应用中,该技术的运行速度较慢。
项世军,黄继武,王永雄在Chinese Journal of Computers(2006,29(2):308-316)中记载了“一种抗D/A和A/D变换的音频水印算法”,该技术将原始语音分段,并将同步码和水印以基于三段系数能量关系的方法嵌入在音频的低频小波系数中,使得音频水印具有较好的透明性和鲁棒性。由于水印的嵌入,音频数据被更改,因此音频的透明性不能得到很好的保证。
温泉,王树勋,年桂君在《电子学报》(2007,35(9):1702-1705)中记载了“水印算法和不可感知性测度”,该技术通过改变正、负直流系数个数来实现水印的嵌入。但为了保证较好的鲁棒性,该方法需要以较低的嵌入带宽和对音频质量的削减作为代价。
综上所述,目前大多数的鲁棒音频水印方法都只能兼顾鲁棒性、透明性和带宽中的一项或两项技术指标。而这三项技术指标对数字音频水印的实际应用具有十分重要的意义。因此,如何设计出一种同时具有良好鲁棒性和透明性,并且拥有较高带宽的数字音频水印方法,已经成为一项急需解决的关键技术。
【发明内容】
本发明针对现有技术存在的上述不足,提供一种基于离散余弦变换的音频零水印防噪检测方法,在提高数字音频水印的鲁棒性的同时,能够保证良好的透明性和较高的嵌入带宽。
本发明是通过以下技术方案实现的,本发明通过零水印防噪嵌入方法对带有原始水印序列音频进行DCT变换提取获得直流系数,并以其绝对值降序排列后生成二值特征序列,最后将二值特征序列与原始水印序列进行异或运算得到检测密钥,再根据检测密钥,通过零水印检测方法对待测音频信号进行音频的零水印检测。
所述的零水印防噪嵌入方法包括以下步骤:
第一步、对原始音频进行分段并对每段音频进行DCT变换,然后提取出每段音频所对应的带有正负特征的DCT直流系数序列;
第二步、将原始水印图像扩展为一维序列,并进行置乱处理后得到置乱水印和第一密钥;
所述的置乱处理是指:采用随机函数将一维序列的顺序重置,将重置后的序列作为置乱水印并将一维序列打乱前后地序号对应关系保存为第一密钥,具体如下:
Q={q(k)|1≤k≤M}=Perm(P,key1);
其中:Perm(·)为随机函数,Q为待嵌入的一维序列,M为水印长度,key1为第一密钥,q为序列像素。
第三步、将第一步中的DCT直流系数按照其绝对值从大到小排序并作为第二密钥,然后提取每个DCT直流系数的正负特征并生成二值特征序列,最后从二值特征序列中依次选出与置乱水印长度相等的比特位,使置乱水印和二值特征序列一一对应;
第四步、将置乱水印与二值特征序列进行异或运算得到检测密钥,保存该检测密钥用于水印的检测。
所述的零水印检测方法包括以下步骤:
步骤一、将待测音频信号分为若干帧,每帧取若干个采样点;
步骤二、根据采样点对每帧音频进行DCT变换得到频域序列,然后提取得到频域序列中每一帧所对应的直流系数,组成待检序列;
步骤三、利用第二密钥对待检序列进行译码处理,得到音频的特征序列;
所述的译码处理是指:提取待检序列中第二密钥所对应系数的正负性,若该直流系数大于零,则其对应的特征序列比特为1,否则为0。
步骤四、将特征序列和检测密钥进行异或运算得到水印序列,然后利用第一密钥对水印序列进行反置乱处理得到恢复序列,最后将恢复序列扩展为二维图像,当二维图像与原始水印图像相同时则实现零水印图像的检测。
所述的反置乱处理是指:根据第一密钥来恢复水印序列在嵌入之前的顺序。
与现有技术相比,本发明能够在保证良好的透明性和较高的嵌入带宽的前提下,提供良好的鲁棒性。
【附图说明】
图1为实施例零水印嵌入方法示意图。
图2为实施例零水印检测方法示意图。
图3为实施例水印示意图。
【具体实施方式】
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本实施例采用单声道、采样率为44.1kHz的音乐和语音各一段作为原始音频信号,音频长度均为17.5s,将一张50×70的二值图像作为水印,每帧的长度L=20。
如图1所示,首先对零水印进行嵌入:
1)将原始音频S进行分段,并对每段音频Sk进行DCT变换,得到DCT域的系数fk={fk(i)|i=1,2,...,L,k=1,2,...,U}:
Sk={sk(i)=s(j)|i=1,2,...,L,k=1,2,...,U,j=(k-1)·L+i};
fk=DCT(Sk)(k=1,2,...,U);
2)提取每段DCT系数中的直流系数,即fk(1),得到直流系数序列fDC:
fDC={fDC(k)=fk(1)|k=1,2,...,U};
对fDC按照绝对值从大到小排序,并取其中绝对值较大的M个系数得到直流系数矩阵FDC:
[FDC,key2]=Sort(|fDC|,DESC);
key2={l(k)|l(k)∈[1,U],k=1,2,...,M};
FDC={FDC(k)=fDC(l(k))|k=1,2,...,M};
其中:Sort(·)为排序函数,DESC代表降序排列。key2中的元素l(k)为FDC(k)在fDC中的序号,保存key2,作为提取零水印的密钥。
3)提取FDC中每个系数的正负号特征,生成二值特征序列H={h(k)|k=1,2,...,M},其中:
h(k)=1,ifFDC(k)>00,otherwise,(k=1,2,...,M);]]>
4)将水印序列Q与特征序列H进行异或运算,保存结果key3,作为零水印提取的密钥:
key3=Q⊕H;]]>
其中:为异或运算。
如图2所示,为零水印的检测方法,具体包括以下步骤:
1)假设待测音频信号为S^={s^(i)|i=1,2,...,N},]]>将分为U帧,每帧L个采样点。
2)对每帧音频进行DCT变换得到提取每帧直流系数得到:
f^DC={f^DC(k)=f^k(1)|k=1,2,...,U}]]>
3)利用密钥key2,获取音频的特征序列H^={h^(k)|k=1,2,...,M}:]]>
h^(k)=1,iff^DC(l(k))>00,otherwise,(k=1,2,...,M)]]>
4)将密钥key3和特征序列进行异或运算,提取水印序列如下式所示。然后利用密钥key1对反置乱,得到一维序列最后将扩展为二维图像则即为所提取的水印图像。
Q^=key3⊕H^]]>
技术效果:
本实施例使用信噪比(SNR)来评判此水印方法的透明性:
SNR(S,S^)=10log10[Σi=0N-1/Σi=0N-1[S(i)-S^(i)]2];]]>
其中:S和分别表示原始音频信号和含有水印的音频信号,N为音频信号的长度。
本实施例计算两者的归一化互相关系数(NC)以及误码率(BER):
NC(w,w^)=Σi=1aΣj=1bw(i,j)·w^(i,j)Σi=1aΣj=1bw2(i,j)·Σi=1aΣj=1bw^2(i,j);]]>BER=DM;]]>
其中:w和分别代表原始水印和检测到的水印,D代表误码的比特数,M代表总比特数。该方法中水印的嵌入带宽可表示为:
Bandwidth=MN·Fs;]]>
其中:M为水印总比特数,N为音频总采样点数,Fs为音频的采样率。
(1)透明性测试
本发明方法采用了零水印的嵌入方法,水印的嵌入不带来原始音频采样点系数的变化。因此,音频的质量不受影响。计算得到该方法SNR=Inf,即信噪比为无穷大。
(2)鲁棒性测试
在该实施例的鲁棒性测试中,使用Stirmark for Audio VO2分别对嵌入水印的音乐和语音进行各种攻击,计算各自的NC和BER,并显示所恢复的水印图像。计算本实验的带宽为Bandwidth=200bps,远超过IFPI对带宽的最低要求20bps,分析结果如下表所示。