增大数据集的尺寸和加水印 发明背景
1.发明领域
本发明涉及数据保护领域,特别是涉及到防止数据被从远端位置非法复制。
2.相关技术描述
数据保护正成为安全性的一个越来越重要的方面。在许多情形下,对复制或者以其它方式处理信息的授权是通过对于特定的特性来评估复制保护的材料的编码而验证的。例如,复制保护的材料可以包含标识该材料为复制保护地水印或其他编码,以及也包含其他编码,用来标识这种特定的材料复制是否为授权的复制以及它是否可以再次被复制。例如,内容材料的授权复制品可以包含鲁棒水印和脆弱水印。鲁棒水印被预定为是不能从内容材料的编码中去除的。去除水印的企图会导致内容材料的损坏。脆弱水印被预定为当内容材料被非法复制时被损坏。例如,如果内容材料被压缩或者以其它方式被改变,则普通的脆弱水印会被损坏。这样,为有效地通过互联网传送而被压缩的内容材料将以鲁棒水印和损坏的脆弱水印被接收。在本例中被配置成加强复制保护权利的内容处理设备将被配置成用于检测鲁棒水印的存在,以及防止处理包含这个鲁棒水印的内容材料,除非也存在脆弱水印。
通常,水印处理是针对内容材料的一般特性定制的。例如,在频域中,水印被配置成位于原始内容材料的基带内。空间屏蔽被用来使得水印材料不能听见,即使它处在原始内容材料的基带内。另一方面,视频信号的水印需要不同类型的屏蔽,以确保它在再现的图象中不会造成可见的失真。同样地,数据(诸如文本文件)水印也将需要不同类型的屏蔽,以确保它不会有害地影响由典型的应用程序进行的数据处理。
在某些安全系统中,通常在加水印之前,把数据加到原始内容材料上,如图1所示。图上显示内容材料110和数据120的惯用的级联,以形成被提供到水印系统180的复合数据文件150。然而,应当指出,数据添加和加水印的组合常常是有问题的。如果数据120在加水印之前被加上,以及如果数据120不具有与内容材料110的相同的一般特性,则复合的数据和内容材料150可能是与加水印处理180不兼容的,或加水印处理180可能有害地影响加上的数据120。例如,如果加上的数据120具有除内容材料110基带以外的频率分量,则加水印处理180可能在加水印之前滤除这些分量,由此使得数据120失真。或如果加水印处理180不包含滤波器,则当进行加水印处理180时,数据120基带外的分量可能造成混叠。这种混叠多半会产生在内容材料110基带中的频率分量,由此造成内容材料110的失真和/或水印的失真。
发明概要
本发明的一个目的是提供用于通过数据附加而保护内容材料的安全性过程和设备。本发明的另一个目的是提供允许给内容材料和附加的数据的组合加水印的安全性过程和设备。
这些目的和其他目的可以以权利要求1中要求的编码系统和权利要求8中要求的编码方法实现。首先,要被加到内容材料上的数据使用预处理器,后者使遵从内容材料的一般特性的信号作为它的输出。这个预处理的附加数据然后被加到原始内容材料上。通过预处理该附加的数据,而确保该组合的材料是与组合材料的以后的后处理器(诸如加水印处理)可兼容的。
各种有利的实施例在从属权利要求中被阐述。
附图简述
下面参照附图通过例子更详细地说明本发明,其中:
图1举例显示把数据加到内容材料的现有技术级联过程。
图2显示按照本发明的、把数据加到内容材料的处理系统的示例方框图。
图3显示按照本发明的音频编码系统的示例方框图。
图中,相同的参考数字表示类似的或相应的特性或功能。
发明详述
盗用内容材料的常用方法是从它原先的媒体(诸如包含内容材料的原先购买的CD)复制材料,以及把它提供给其他方。这样的盗用的内容材料常常是通过互联网从远端的源可得到的。为了便于下载,经常是从互联网下载单独的歌曲,而不是下载构成该原始媒体上的材料的整组材料。本发明是将经过互联网的材料盗用作为得到非授权材料的手段的范例而给出的,尽管本发明的原理通常可应用于复制保护方案,且不管非授权的材料是如何得到的。
各种各样的技术可被利用来确保内容材料是从原始购买的CD提供的,而不是从内容材料的下载的复制品提供的。如上所述,脆弱水印的使用易于检测原始内容材料的压缩和以后的解压缩,这是基于这样的假设:为了通过互联网有效下载,原始内容材料的非授权复制品将例如通过使用MP3编码被压缩。然而,随着接入互联网的速度的增加,以非压缩形式下载单独的歌曲变得越来越容易,由此会保留该脆弱水印,以及避开这种安全保护。
国际专利申请WO01/57867(代理人档案US000088)教导防止对数据集的子集的接入,除非该数据集的整体性的存在得到验证。这样,例如,在系统允许接入到单个歌曲之前,需要整个CD被下载。这个待决的专利申请教导自引用数据集,它易于确定是否存在数据集的整体性。这个待决的专利申请建立数据集的分段链接表,编码链接地址作为每个分段的水印,以及通过验证该数据集的某些或全部分段的被链接到分段的存在而验证该数据集的整体性的存在。
国际专利申请WO01/59705(代理人档案US000040)教导自引用数据集,其中数据集的每个分段被唯一地识别,以及这个分段识别符以安全的方式与每个分段相联系。为了确保一簇分段都是来自同一个数据集,数据集的识别符也与每个分段一起被安全地编码。优选地,分段识别符和数据集识别符被编码成为嵌入在每个分段中的水印,优选地成为鲁棒和脆弱水印的组合。通过使用穷举或随机采样,该数据集整体性的存在被绝对地或以统计的可靠性来确定。
在这些专利申请的每个专利申请中,如果数据集的整体性不存在,则数据集的数据项目的随后处理被终结。随机采样技术可被采用来验证整体性的存在,到一个期望的可靠性程度,而不用验证整个数据集的每个字节或分段的存在。在数字音频记录方面,一个兼容的重放或记录设备被配置成在缺乏对有关CD的整个内容的存在的验证下,拒绝再现单独的歌曲。
即使以DSL和电缆调制解调器速度下载,以非压缩的数字形式下载CD上的整个唱片集所需要的时间也预期大于一小时,这取决于网络负载和其他因素。因此,通过要求存在CD的整个内容,以超过一小时的下载“花费”为代价,经过互联网上大范围的分发而盗取歌曲的可能性被显著地减小。
为了进一步阻止下载整个数据集,可以通过把字节加到原始内容材料而增加数据集的尺寸。也就是,例如,典型的音频CD可以被编码为多到650兆字节的数据。如果特定的歌曲集并未总计达CD的整个容量,则可以加上数据,以在CD上创建消耗整个量的数据集。优选地,为了进一步阻止压缩数据集的企图或躲避这种安全措施的其他企图,加上随机数据字节。这个随机数据将与数据集的整体性相联系,作为数据集内的附加的分段。或者,也可以加上非随机数据,诸如特定的安全性代码,或在选择再现设备时实施特定操作的指令组。
如上所述,虽然附加数据可以容易地与原始内容材料相级联,形成复合的数据集,但当数据与原始内容材料的组合被提供给后处理器(诸如加水印系统)时可能出现反常的行为。这种反常行为可能影响原始内容材料、附加的数据、或水印、或它们每个的组合的译码。这种反常行为将由与原始内容材料的预期或蕴含的特性不一致的随机数据特性造成。如上所述,非一致性典型地呈现为原始内容材料的特征基带以外的频率分量,虽然也可以呈现为其他的非一致特性。
按照本发明,加到原始内容材料上的数据被约束为与编码的内容材料的特性相兼容。优选地,这种兼容性是通过把附加数据提交到被使用来产生编码内容材料的、同一个编码过程而实现的。例如,音频CD的标准编码形式是“红皮书(Redbook)”编码。如果内容材料以红皮书形式被编码,则在本发明的优选实施例中,加上的数据也通过红皮书编码器被编码。
图2显示按照本发明的编码系统的示例方框图。该系统包括预处理器230和组合器240。系统被配置成提供与后处理器280相兼容的复合输出,该后处理器280是与原始内容材料相兼容的。也就是,如果后处理器280是用来为红皮书编码的音频数据创建水印的加水印系统(图1上的180),则系统被配置成确保内容材料110与附加数据120的组合遵从红皮书标准,而不管附加数据的特性如何。在使用本例的直接的实施例中,附加数据120可以是被提供给作为预处理器230的传统红皮书编码器的模拟音频噪声信号。在更复杂的实施例中,附加数据120可以是二进制数据,预处理器230被配置成把这个数据120变换成加到传统红皮书编码器的音频输入。组合器240组合原始内容材料110和来自预处理器230的预处理数据,产生组合的输出,典型地为原始内容材料110与预处理数据的级联。优选地,相应于预处理数据的组合输出部分可以与原始内容材料适当地区分开,以使得传统的重放设备不会把预处理的数据再现为可听见的形式。
图3显示按照本发明的、用来编码附加的数字数据(诸如随机字节)为适合于加水印形式的编码系统300的示例方框图。在本例中,数字数据120被提供给调制器320,调制器320被配置成把二进制数字变换成音频声音。例如,调制器320可以是传统的调制解调器,它把二进制数字变换成通过电话线传输的音调。调制器320的音频输出被提供给传统的数字记录器330,记录器330把音频输出编码成与内容材料的形式相兼容的形式。正如虚线方块330’所显示的,数字记录器330优选地是相同类型的记录器330’,音频执行器可能被使用来提供原始内容材料110。通过使用相同的记录方案,记录器330的输出确保与记录器330’的输出(即,内容材料110)相兼容。因此,内容材料110与来自记录器330的编码数据的组合350是与加水印系统180相兼容的,该加水印系统180是与记录器330’的输出相兼容的。这样,对作为单个数据集的组合350加水印是件简单的事情。
以上内容仅仅说明本发明的原理。因此将会看到,本领域技术人员能够设计各种不同的安排,虽然这里没有明显地描述,但它体现本发明的原理,因此属于本发明的精神和范围内。例如,虽然以上提供的示例使用音频记录作为本发明的范例应用,但本发明的原理可被应用于任何编码方案。例如,在DVD编码中,附加的数据可以是随机的图象或音频噪声,或二者的组合,它们被编码成与内容材料相同的视频格式,或者它们可以是随机比特,这些随机比特被变换成音频和/或图象信息,随后被变换成需要的视频格式。从公开的内容看来,这些和其他系统配置以及最佳化特性相对于本领域一般技术人员是明显的,它们被包括在以下的权利要求的范围内。