识别媒体来源的方法、加指纹的装置和系统.pdf

摘要
申请专利号：	CN201110276635.0	申请日：	2004.03.31
公开号：	CN102509031A	公开日：	2012.06.20
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):G06F 21/00申请日:20040331\|\|\|公开
IPC分类号：	G06F21/00	主分类号：	G06F21/00
申请人：	索尼电影娱乐公司; 索尼株式会社
发明人：	S·马利克; R·萨希
地址：	美国加利福尼亚州
优先权：	2003.06.23 US 60/480687; 2003.07.31 US 60/491763
专利代理机构：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	宋鹤
PDF下载：	PDF下载

内容摘要

本发明涉及识别媒体来源的方法、加指纹的装置和系统。一种加指纹装置，包括：多个接收单元，接收多个输入数据集，多个输入数据集中的每个被分为多个输入段，多个输入数据集中至少一个被唯一地标记；选择器，从多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及至少一个组合器，排列所选的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于各输入数据集中的输入段的数量。

权利要求书

1：一种加指纹装置，包括：用于接收多个输入数据集的部件，所述多个输入数据集中的每一个被分为多个输入段，所述多个输入数据集中的至少一个被唯一标记；用于从所述多个输入数据集中的至少两个不同的输入数据集的其中之一中选择至少一个输入段的部件；以及至少一个部件，用于排列所选择的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于每个输入数据集中的输入段的数量。
2：一种用于为媒体加指纹的加指纹系统，包括：用于接收分为多个媒体段的所述媒体的部件；用于标记分为多个媒体段的所述媒体并产生至少一个已标记媒体的部件，所述至少一个已标记媒体中的每一个被分为多个已标记媒体段；用于压缩分为多个媒体段的所述媒体以及至少一个已标记媒体的部件；用于从分为多个媒体段的所述媒体和至少一个已标记媒体的其中之一中选择至少一个分为多个媒体段的媒体或已标记媒体段的部件；以及至少一个部件，用于排列所选择的至少一个分为多个媒体段的媒体或已标记媒体段，从而产生具有多个已加指纹段的已加指纹媒体，使得已加指纹段的数量等于所述媒体中的媒体段的数量或者已标记媒体中的已标记媒体段的数量。

说明书

识别媒体来源的方法、加指纹的装置和系统
    本申请是申请日为 2004 年 3 月 31 日、申请号为 200480023708.3、发明名称为 “为数据加指纹” 的发明专利申请的分案申请。相关申请的交叉引用
     这个申请要求 2003 年 6 月 23 日提交的标题为 “采用已标记和未标记内容的伪随机组合为数据加指纹” 、序号为 60/480687 的共同未决美国临时专利申请的优先权益。这个申请还要求 2003 年 7 月 31 日提交的标题为 “为数据加指纹” 、序号为 60/491763 的共同未决美国临时专利申请的优先权益。由此要求 2003 年 6 月 23 日和 2003 年 7 月 31 日的提交日期的优先权益，以及通过引用将这些临时专利申请的公开结合于此。
     技术领域
     本发明涉及识别媒体来源的方法，用于为媒体加指纹的加指纹系统或装置。背景技术因特网的迅速发展以及所产生的数字数据复制和散布的可能性导致对于防止这些非法活动以及使版权所有者免于与盗版副本关联的问题的方式的不断增长的需求。例如，未授权副本可能由数字数据的授权分发副本 ( 例如商业副本 ) 制成。通过比较给定的数字数据文档与未授权或非法散布的副本，水印能够为版权所有者提供该文档是版权所有者自己的知识产权的证明。为了压制、防止或禁止未授权副本的扩散，通过确定用来制作未授权副本的具体分发副本来了解未授权副本的来源往往是有用的。但是，可能难以采用加水印来识别用于产生未授权副本的分发副本。
     数字加水印可用来确定未授权或非法散布副本的来源。例如，当文档采用数字加水印来保护时，标识要接收文档的电子分发副本的顾客的标识符可通过察觉不到的方式与版权所有者的水印一起嵌入文档中。如果顾客违反版权所有者的利益而散布分发副本的副本，则可根据数字水印来识别该顾客，它将被包含在所有未授权或非法散布副本中。但是，当许多分发副本要合法地散布到许多不同顾客时，对每个分发副本分别进行数字加水印通常证明是不便且费时的。
     发明内容本发明提供用于实现为数据加指纹的方法及装置。在一个实现中，加指纹的方法包括：接收多个输入数据集，所述多个输入数据集中的每个被分为多个输入段，所述多个输入数据集中至少一个被唯一地标记；从所述多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及排列所述选择的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于各输入数据集中的输入段的数量。
     在另一个实现中，加指纹装置包括：多个接收单元，接收多个输入数据集，多个输入数据集中的每个被分为多个输入段，多个输入数据集中至少一个被唯一地标记；选择器，从多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及至少一个组合器，排列所选的至少一个输入段，从而产生具有多个输出段的输出数据集，使得
     输出段的数量等于各输入数据集中的输入段的数量。
     在另一个实现中，用于为媒体加指纹的加指纹系统包括：接收器，接收分为多个媒体段的所述媒体；标记所述媒体的第一编码器，所述第一编码器产生至少一个已标记媒体，至少一个已标记媒体中的每个被分为多个已标记媒体段；第二编码器，比较所述媒体和至少一个已标记媒体；选择器，从所述媒体和至少一个已标记媒体其中之一中选择至少一个媒体或已标记媒体段；以及至少一个组合器，排列所选的至少一个媒体或已标记媒体段，从而产生具有多个加指纹段的加指纹媒体，使得加指纹段的数量等于各媒体或已标记媒体中的媒体或已标记媒体段的数量。
     在另一个实现中，识别媒体的来源的方法包括：接收所述媒体，并且识别经过排列而形成所述媒体的多个段；从多个段的排列中产生典型正本密钥 (RMK) ；接收指纹和链接到指纹的源；以及比较 RMK 与指纹。附图说明
     图 1 说明用于采用两个正本来产生加指纹内容的过程的实现。
     图 2 说明用于实现数据的加指纹的方法。
     图 3 说明把各有五个段的三个正本组合的表示。
     图 4 说明用于产生 DVD 封装媒体的加指纹过程的一种可能的实现。
     图 5 说明根据一种实现、用于产生 DVD 封装媒体的加指纹过程的另一种可能的实现。
     图 6 说明配置成处理输入正本的段的段重组器的详细示图。
     图 7 说明逐段组合两个媒体文件以产生下载媒体的唯一加指纹版本的一种实现。图 8 说明逐段组合两个媒体文件以产生视频点播内容的唯一加指纹版本的一种图 9 说明根据采用 RMK 和 KS 的一种实现来识别媒体来源的一种方法。实现。
     具体实施方式
     本公开描述在加指纹媒体生成和系统健壮性方面提供更高效率的系统及方法。
     在一种实现中，加指纹系统采用已标记和未标记内容的伪随机组合来提供数据的加指纹。已加指纹数据则可用来唯一识别内容使用争论。系统适用于各种类型的数据，例如视频和音频基本数据或复用流。系统还可应用于封装媒体，例如 DVD 和录像带、从因特网下载的内容和 / 或其它任何介质。
     图 1 说明用于采用第一正本 100 和第二正本 102 来产生已加指纹内容的过程的实现。在其它实现中，可采用不同数量的正本，例如三个或三个以上。该过程包括产生多个正本 (mi)，其中下标 i 表示第 i 个正本。第一正本 100 是未标记的。第二正本 102 例如通过采用数字加水印技术来唯一标记。在具有三个或三个以上正本的另一种实现中，一个正本是未标记的，而其它正本中的每个被唯一地标记 ( 例如，第二正本以不同于第三正本的方式来标记 )。在另一种实现中，每个正本被唯一地标记。
     正本 100、 102 则被分为 n 个部分或段。未标记正本 100 中的各段为相同大小，并且具有与已标记正本 102 的相应段相同的内容 ( 例如，正本 100 的段 1 与正本 102 的段 1 的大小相同并且包括相同内容 )。这样，副本 104、 106 可通过伪随机组合来自不同正本 100、 102 的段来产生，下面进行描述。虽然未标记正本 100 的内容与已标记正本 102 的内容相同，但每个正本将具有不同的标记。例如，未标记正本 100 的第一段具有与已标记正本 102 的第一段相同的内容，但是，未标记正本 100 的第一段没有被标记，而已标记正本 102 的第一段则被标记。因此，相应段中的基本信息是相同的，但是数据可能以不影响内容但允许段被区分的方式不同 ( 在比较未标记和加水印数据时通常是这样的 )。
     根据来自 m 个正本的 n 个相应段的组合的伪随机生成，产生正本的副本，它包括与正本相同的 n 个相应段，但各段取自伪随机选取的正本。这些段以伪随机方式来选取和组合 ( 连接 )，使得那 n 个段产生具有伪随机生成的段序列作为指纹的副本。副本的指纹标识副本中各段的源正本。因此，伪随机生成经过配置，使得可为各副本产生截然不同的指纹。多个伪随机数被产生，它伪随机地分配来自正本的段，使得截然不同的指纹可分配给所有副本，而没有重复段组合的模式。因此，所产生的伪随机数的数量必须等于或超过预期副本数量。
     在图 2 所示的流程图中说明一种用于实现上述数据加指纹的方法。在 200 接收多个正本，在其中，每个正本被分为多个段，以及每个正本被唯一地标记 ( 例如数字加水印 )。在一个实现中，一个正本保持未标记。正本中的第一段对应于其它正本中的每个的第一段。在一个实现中，各段因段中的相应标记 ( 或没有标记 ) 而可与其它正本的相应段区分开 ( 可确定那个段所属的正本 )。在另一个实现中，不是所有的段都可与相应的段区分开。在 202，选取来自至少两个不同正本之一的至少一个段。在 204，则产生指纹。在一种实现中，指纹是伪随机数序列。在 206，根据指纹来排列所选段，从而产生输出数据集，使得输出数据集中的段的数量等于每个正本中的段的数量。下面参照图 3 来描述选择和排列段的一个实例。在 208，所产生的输出数据集存储在一种媒体产品、如封装介质中 ( 例如烧录到 CD 或 DVD 上、复制到 VHS 磁带上 )，从而产生分发副本。在 210，指纹被链接到封装介质，以及链接被存储 ( 例如指纹、标识特定媒体项的 ID 代码以及标识要接收该媒体项的顾客的 ID 代码存储在数据库表条目中 )。
     伪随机数生成器确定要选取和排列段的模式。因此，生成器必须没有重复地产生足够多数量的伪随机数。在一个实现中，生成器产生数字，其中包括用于各段的一位，以及每位具有从 1 到正本数量的范围。各位对应副本中的某个段，以及位的值表明从哪个正本复制了该段。在另一种实现中，生成器产生适合于各段的数字作为一位，并把各位共同收集到模式中。
     例如，如图 3 所示，如果存在三个正本 1、 2 和 3，并且每个正本被分为五段，则伪随机数生成器产生五位数字，其中每位的值的范围为 1 至 3，从而产生例如 ‘13213’ 和 ‘22131’ 之类的数模式。这些伪随机数模式可用于分别产生副本 1 和副本 2 的段，其中数模式的各位表明源正本的段。
     例如，正本 1 的段由范围从 1 至 5 的数序列表示，正本 2 的段由范围从 1’ 至 5’ 的数序列表示，以及正本 3 的段由范围从 1” 至 5” 的数序列表示。在图 3 的所述实例中，伪随机数生成器已经把伪随机数序列 ‘13213’ 分配给副本 1，以及把伪随机数序列 ‘22131’ 分配给副本 2。这样，副本 1 的序列 ‘13213’ 表明段 1 将从正本 1 中复制，段 2 将从正本 3 中复制，依次类推。因此，副本 1 的段可作为 1-2” -3’ -4-5” 来产生。副本 2 的段可类似地作为
     1’ -2’ -3-4” -5 来产生。各副本的伪随机数序列则可存储在数据库中，并且链接到请求该数据的特定用户和 / 或链接到存储数据的一种媒体产品。这些数据库条目可在后来用于源识别。
     为了提供对于已加指纹媒体生成的效率和系统健壮性的了解，可分析确定伪随机数序列的数量的因素。例如，可能的各个指纹的数量由三个因素来确定：正本数量 (m)、正本中的段的数量 (n) 以及可交换的段的最小数量 (k)。采用这些因素，组合的数量 (c) 可如下确定。
     如果多达 n 个段是可交换的，则组合的数量被确定为：
     如果 n 中的多达 k 个段是可交换的，则组合的数量被确定为：如果 n 中正好 k 个段是可交换的，则组合的数量被确定为： k n
     c ＝ (m-1) . Ck [3] n
     其中 Ck，表示 n 个中一次取 k’ 个的组合，而 nCk 则表示 n 个中一次取 k 个的组合。
     例如，如果对于 120 分钟的影片有两个正本 (m ＝ 2)，以及每个正本被分为 60 个段 (n ＝ 60) 并且 60 个段中只有 20 个段 (k ＝ 20) 是可交换的，则利用等式 [2]，唯一组合的数量被确定为 4,191,844,505,805,495( 超过 4000 万亿 )。对于更简单的设置，假定有两个正本 (m ＝ 2)，每个正本具有 20 个段 (n ＝ 20)，以及全部 20 个段都是可交换的。利用等式 [1]，可能的组合的数量被确定为 1,048,576。表 1 说明组合如何随着正本和段的数量来缩放 (c 的值对于较大数进行了近似 )。
     m 2 3 5 10 2 2 2 2 n 20 20 20 20 10 20 60 99 c 1,048,576 3,486,784,401 95,367,431,640,625 100,000,000,000,000,000,000 1,024 1,048,576 1,152,921,504,606,847,000 633,825,300,114,114,700,000,000,000,000表1
     上述数据加指纹技术可应用于其中为传输而产生物理封装的各种不同的媒体。例如，数据的加指纹可应用于提交给奥斯卡评审员以便审查影片的 DVD 封装媒体 ( “奥斯卡筛选者” )、应用于从因特网下载的内容媒体或者应用于电缆传递的视频点播 (VOD)。下面详细描述这些应用的每一个。其它应用包括家庭组网、定制随选 CD/DVD 编制、客户机端 “烧录” 到 CD/DVD 可记录媒体上以及其它相关媒体。此外，加指纹技术可移植到采用转换开关的模拟程序分块。
     来自奥斯卡筛选者媒体 ( 例如 DVD 封装媒体或 VHS 磁带 ) 的盗版问题得到理解和承认。已经提出的一种解决方案是分别标记 ( 例如采用唯一水印 ) 每一个发出的副本，使得电影被标记、编码以及分别 “烧录” 到各 DVD 上或者录制到 VHS。但是，如上所述，采用不同水印分别标记各副本可能是非常繁重且费时的。
     图 4 说明分别标记 DVD 封装媒体的典型方法的一种可能实现。该过程以未标记视频文件 400 开始。要产生的所有 DVD 副本的标识符 (ID) 存储在数据库 402 中。
     视频文件 400 在水印编码器 404 中采用唯一 ID 加水印，从而产生已加水印视频文件 406。唯一 ID 存储在数据库条目中。然后，已加水印视频文件 406 采用视频编码器 408 进行编码，它产生压缩视频文件 410。在一个实现中，视频编码器可配置为 MPEG-2 编码器。压缩视频文件 410 与压缩音频文件 420 在复用器 412 中组合，从而产生一个或多个组合视频 - 音频文件及元数据文件 414。一个或多个组合视频 - 音频文件与元数据文件 414 一起在 DVD 烧录器 416 中被烧录到 DVD 上，从而产生 DVD 副本 418。标识特定 DVD 的 ID 存储在那个 DVD 上的水印的唯一 ID 所用的数据库条目中。
     虽然依照产生分别标记的 DVD 副本来描述上述过程，但是应当理解，这个过程通常必须为待制作的预期数量 (x) 的 DVD 副本重复。因此，上述过程在技术上是可行的，但在实际上实现此过程是繁重且昂贵的。例如，对于 2 小时影片，水印编码器 404 的加水印过程通常可能耗用多达八小时。视频编码器 408 中的 MPEG-2 编码过程可能耗用多达两小时。复用器 412 中的音频 - 视频组合过程可能耗用多达大约 30 分钟，以及 DVD 烧录过程可能耗用多达另外 30 分钟。因此可以看到，每个 DVD 副本的产生可能耗用多达大约 11 个小时。虽然可部署附加资源并行创建分别标记的副本，但是对于大量的副本，并行性可能变得昂贵。
     图 5 说明用于产生 DVD 封装媒体的加指纹过程的一种实现。采用图 5 的实现，可显著加快产生 DVD 副本的过程。
     在图 5 的实现中，过程以视频正本 500 开始。然后产生视频正本 500 的两个副本 504。视频正本的第一副本 504A 未被标记，而第二副本 504B 则由水印编码器 502 加水印。特定加水印标识符 (ID) 用来对标记副本 504B 编码。在另一个实现中，可采用不同的标记过程。
     然后，视频正本的两个副本 504A、 504B 分别采用视频编码器 506A、 506B 来编码。视频编码器 506A、 506B 分别产生压缩视频文件 508A、 508B。压缩视频文件 508A 未被标记，而压缩视频文件 508B 被标记。在一个实现中，视频编码器配置为 MPEG-2 编码器。
     压缩视频文件 508A、 508B 与压缩音频文件 520 分别在一对复用器 510A、 510B 中被组合，从而分别产生组合视频 - 音频文件 532A、 532B。复用器 510 配置为以称作视频对象 (VOB) 的段来处理压缩文件 508。组合视频 - 音频文件 532A 是具有多个段的未标记 DVD 文
     件。组合视频 - 音频文件 532B 是具有与未标记文件 532A 相同数量的段的已标记 DVD 文件。这样， DVD 文件 532A、 532B 在它们的关系方面实际上与图 1 所示的两个正本 100、 102 之间的关系相似。下面详细描述 VOB 段。
     段重组器 534A、 534B 采用两个正本 DVD 文件 532A、 532B 来产生与图 1 所示的副本 104、 106 相似的加指纹副本。每个段重组器 534 采用唯一标识符来重组 ( 连接 ) 每个正本 532 的不同段。如上所述，各标识符由伪随机数生成器产生，并存储在数据库 522 中，以便标识每个副本和 / 或每种媒体的接收方。这样，图 1 实际上表示块 530 的一种实现的操作。
     然后，在段重组器 534A、 534B 的输出上产生的已加指纹副本分别采用 DVD 烧录器 540A、 540B 烧录到 DVD 542A、 542B 上。为了制作附加副本，来自未标记和已标记正本 532A、 B 的段的不同组合在重组器 534A、 B 中任一个中被组合，然后被烧录到 DVD 上。由水印编码器 502 加水印、由编码器 506 编码以及由复用器 510 复用和处理没有对每个副本重复进行。因此，在图 5 的实现中，与图 4 的实现不同，重组器对段的重组以及到 DVD 的烧录被重复进行，以便产生预期数量 (x) 的 DVD 副本 542，而不是重复整个过程中的每个步骤。这样，图5 所示的过程应当耗用实质上更少的时间，因为加水印仅对一个视频正本进行一次。因此，块 530 和 540 所表示的过程应当对于每个 DVD 耗用不到一个小时。图 6 说明根据 DVD 特定的实现、配置成处理输入正本的段的段重组器 534 的详细示图。但是，图 6 所示的实现可扩展到其它封装媒体、如录像带。
     DVD 段在某些预定的视频对象单元 (VOBU) 边界上产生，并分组为 ‘VOBU 组’ 。每个 VOBU 组是独立的复用单元，并且没有与先前或以后单元的相关性。此外， VOBU 由一个或多个图片组 (GOP) 构成。如 DVD-VIDEO 格式中定义的， VOBU 可能是 0.4 至 1.2 秒长。VOBU 组可能具有必需数量的 VOBU。
     VOBU 组被组合以形成 VOB 文件集。对于每个 VOB 文件集产生元数据 (IFO) 文件。元数据文件提供的细节之一是 VOB 文件集中的 VOBU 的偏移信息。对于最终用户，从这个 VOB 重放看起来就像从任何常规 DVD 上的 VOB 重放。然而在内部， VOB 是 VOBU 组的组合，各 VOBU 组由从两个不同视频 (MPEG-2) 编码的部分复用的数据构成。这样， VOB 遵循 DVD 规范限制，并且实质上是相符的。因此，如果这些 DVD 其中之一通过剖解或者通过重新编码被盗版 ( 例如以如 DiVx 或 Xvid 之类的格式 )，则系统可通过分析视频流并定位其中存在已标记视频段的点来识别盗版副本的来源。系统可比较这些位置与烧录 DVD 时创建的、数据库服务器中存储的位置。各 DVD 对于已标记段具有唯一模式，因此各 DVD 被有效地 “加指纹” 。
     与图 5 所示的实现相似的一种实现可用来对于从因特网下载的内容媒体加指纹。在图 7 的所示实现 700 中，一个未标记 702A 和一个加水印 702B 的两个媒体文件被分为若干段，以及组合器 704 以唯一模式组合这些段，从而为每个下载产生内容的唯一加指纹版本。每个唯一组合采用标识符来产生，所述标识符由伪随机数生成器所产生，并且存储在数据库 706 中以标识加指纹副本。已加指纹副本通过万维网服务器 708 来存储或者流式传输，以便通过因特网 710 下载到客户 PC 712。对于客户 PC 712，重组 / 加指纹文件 714 表现为一个连续文件。客户不了解在万维网服务器 708 上发生的重组 ( 即加指纹 )。
     与图 7 的实现相似， VOD( 视频点播 ) 内容可加指纹，如图 8 所示。在这个实现中， VOD 服务器从分为段的两个媒体文件、即一个未标记 802A 和一个加水印 802B 来创建加指纹文件。两个媒体文件 802A、 802B 在组合器 804 中逐段被组合，从而对每个传递产生内容的
     唯一加指纹版本。由于 VOD 媒体文件通常是经过分组化的 MPEG-2 传输流数据，这些文件是这种加指纹的优良候选者。
     在图 8 的所述实现中，两个媒体文件 802A、 802B 在 VOD 服务器 808 中被组合。因此，所述情况称作单播情况，即数据在来源处被组合，然后被发送到特定目的地，其中目的地不了解其它分发副本。
     在另一个实现中 ( 未示出 )，卫星可向每个卫星接收器盒广播多个正本 ( 即，向每个盒的多个正本的同时联播 )。这种实现称作多播情况。在这种实现中，卫星接收器盒从服务器接收 RMK 信息，并且在把数据提供给 TV 之前执行组合。这样，在这种实现中，在 VOD 机顶盒 812 上发生组合。
     每个唯一组合采用由伪随机数生成器所产生并且存储在数据库 806 中以标识加指纹副本的标识符来产生。已加指纹副本通过电缆网络 810 被送到 VOD 机顶盒 812。已加指纹副本经过处理并传递给客户 TV 814。对于客户 TV 814，重组 / 加指纹文件 816 表现为一个相连文件。客户不了解在 VOD 服务器 808 上发生的重组 ( 即加指纹 )。
     可执行数据的加指纹以为系统提供健壮性以及媒体来源识别的方法。具体来说，来自 m 个正本的 n 个段的组合的伪随机生成可有效地配置成提供对于通过采用多个或部分副本生成单一未授权副本来避开来源标识的企图的预防。在一个实现中，产生伪随机序列，使得来源可以仅采用未授权副本的一小部分来标识。在另一个实现中，对于基于组合多个来源的未授权副本，多个来源可通过相似方式来标识。在一个实现中，典型正本密钥 (RMK) 就来源标识而言用于系统的健壮性。 RMK 是构造 ( 副本 ) 的段的依次读出。如上所述，来自 m 个正本的 n 个段用来构建副本。读出包括 n 位 ( 对于 n 个段 )，其中，每位的值的范围从 1 到 m。位也可能具有 X 值，意味着它的值无关紧要 ( 即 “无关的” )。这样，具有从八个正本产生的十段的分发副本可能具有 “1， 4， 2， 5， X， 6， X， 1， 6， 2” 的 RMK。
     RMK 也可被定义为 ‘元组’ 的序列，在其中，各元组的形式是 (x， y)。项 x 为段号 ( 从 1 到 n 依次改变 )，以及项 y 为段值 ( 值的范围从 1 到 m，或者具有 X 值 )。在这种情况中，上述 RMK 可写作 “(1， 1)(2， 4)(3， 2)(4， 5)(5， X)(6， 6)(7， X)(8， 1)(9， 6)(10， 2)” 。因此， RMK 也可写作形式为 ( 元组顺序，正本编号 ) 的元组序列。
     制作具有不同指纹标识符的两个或两个以上分发副本的一种方法是为副本提供不同的 RMK。这样，当被提供未知来源的副本时，系统可对副本的 RMK 进行解码或解密 ( 例如，通过分析副本中的每个段的标记，以便确定那个段的源正本 )，并从查找表 / 数据库确定那个副本的来源 ( 例如原始分发的副本的接收方 )。但是，如果未授权副本已经从多个分发副本或者从分发副本的一部分中产生，则未授权副本可能具有未在数据库中注册的 RMK，或者具有注册为另一个顾客的 RMK，它表明错误肯定标识。因此，如何构建 RMK 的决定在数据加指纹过程中可能是重要的。
     在一个实现中， RMK 具有一个或多个密钥集 (KS)。每个 KS 的长度范围从 1 到段的总数 (n)，以及以元组列表的形式从 RMK 中读出，并以 “元组顺序” 的升序排列，如上所述。 RMK 的不同 KS 可能是不同长度。这样，在一个实例中， KS 可能是如下所示： KS1 ＝ (2， 4)(3， 2)(4， 5) ； KS2 ＝ (1， 1)(2， 4)(6， 6)(10， 2) ； KS3 ＝ (1， 1)(2， 4)(3， 2)(4， 5)(5， X)(6， 6)(7， X) (8， 1)(9， 6)(10， 2) ； KS4 ＝ (4， 5) ；等等。当未知副本的 RMK 无法匹配查找表中列出的分发
     副本的任一个的 RMK 时，系统可执行数学计算，以便确定未知副本的多少 KS 匹配查找表中的分发副本的 KS。未知副本的源分发副本将被确定为提供高于所选门限值的 KS 匹配数量的分发副本。
     不同的 KS 可能具有不同的生成技术。为了确定 KS 的值，那个 KS 的生成技术应用于副本的 RMK。例如，这些技术的一部分是比较简单的，使得对不同的 RMK 产生特定长度的 KS。在 KS 生成技术的一种实现中，如果 KS4 是第四元组，则对于 RMK ＝ “(1， 1)(2， 4)(3， 2) (4， 5)(5， X)(6， 6)(7， X)(8， 1)(9， 6)(10， 2)” ， KS4 ＝ (4， 5)。但是，对于另一个 RMK， KS4 可能是 KS4 ＝ (4， 7)，等等。
     其它 KS 可具有更详细的生成过程。在 KS 生成技术的另一种实现中， KS12 可能以具有 RMK 中存在的最高正本编号的最低顺序元组开始，之后跟随比第一个具有较低正本编号的较高顺序元组，之后跟随正本编号的降序中的下一个。对于 RMK ＝ “(1， 1)(2， 4)(3， 2) (4， 5)(5， X)(6， 6)(7， X)(8， 1)(9， 6)(10， 2)” ，由于当前的最高正本编号为 6，因此在 (6， 6) 和 (9， 6) 中，该过程选择 (6， 6)，因为它具有比 (9， 6) 更低的顺序。所选的下一个元组将是具有比 6 更低的正本编号、但具有较高顺序的元组，这把过程引导到 (10， 2)。随后，不存在匹配集合规则的其它元组，因此过程以 KS12 ＝ (6， 6)(10， 2) 结束。在 KS12 的情况中， KS 的长度由于此过程的选择而不是固定的。
     上述过程只是可用于获得优良 KS 的许多可能性中的几个。因此，加指纹系统将具有 RMK 以及引用数据库中所存储的各分发副本的 RMK 的多个 KS。给定未知来源的副本，系统获得未知副本的 RMK。如果在数据库中没有 RMK 匹配，则系统产生那个 RMK 的 KS。由于某些 KS 将在某些区域中定位，因此，存在系统能够识别可能产生那个特定 RMK 的来源的至少一部分的可能性。
     可以看到，上述 KS 生成技术可以相反地用于产生难以隐藏的优良 RMK 集合。RMK 集合可用来构建用于分发副本的一组伪随机数，使得副本包括难以隐藏的某些 KS。
     存在其它方式来增加加指纹系统的健壮性。在一种实现中，数据形式的 RMK 和 / 或一个或多个 KS 可被插入分发副本本身中。在分发副本的生成时间中，插入可在不同位置以及在不同方面进行。这将允许系统识别未知副本，即使该副本具有分发副本的极小部分。如果那个小部分包括 RMK 的一个或多个部分和 / 或在任何方面插入的一个或多个 KS 数据，则未知副本可被识别为源自分发副本。
     在向加指纹系统提供健壮性的另一个实现中，在分发副本的生成时间中，伪数据可以数据形式在不同位置以及在不同方面被插入分发副本本身中。插入可以伪随机方式进行，以便阻止通过模式匹配两个或两个以上分发副本来避开指纹的企图。
     在又一个实现中，分发副本的某些或所有方面可采用 RMK 的标识符和 / 或一个或多个 KS 来标记。在这种情况中，即使副本从其它许多分发副本中重新制作，也可查询分发副本的所需方面，从而识别重新制作的副本的来源。
     图 9 说明根据采用 RMK 和 KS 的一种实现、识别媒体来源的一种方法。一开始，在 900 接收要识别的媒体，以及识别经排列以形成媒体的段。然后，在 902，从段的排列中产生典型正本密钥 (RMK)。数据库存储所产生的分发副本的指纹以及链接到指纹、表明接收了与所链接指纹对应的分发副本的来源的标识符。在一个实现中，链接到指纹的来源可能是接收分发副本的人的名字。在 906，从数据库接收指纹和链接到指纹的来源。RMK 和指纹在 906 进行比较。如果比较产生匹配 ( 即在 908 的 “是” 结果 )，则在 910 输出所链接来源。否则，如果 RMK 与指纹之间的比较没有产生匹配 ( 即在 908 的 “否” 结果 )，则在 912，从数据库接收下一个指纹和所链接来源。
     如果已经针对 RMK 检查了所有指纹，并且没有匹配，则在 914，从 RMK 产生密钥集。这样，当 RMK 与指纹之间不存在匹配时，它表示所关注媒体可能不是完全从一个分发副本中复制的。因此产生密钥集，以便分析媒体的各部分，从而识别来源。
     在 916，从数据库接收指纹和链接到指纹的来源。在 918，从指纹产生密钥集。从 RMK 产生的密钥集以及从指纹产生的密钥集在 920 进行比较。如果在 922，密钥集之间匹配的数量超过某个门限值，则在 924，链接到指纹的来源被记录。在 926，从数据库接收下一个指纹和所链接来源，以及产生那个指纹的密钥集供比较，并返回到 918。当所有指纹的密钥集已经与 RMK 的密钥集进行了比较，则在 928 输出在 924 记录的来源，作为在 900 所接收的媒体的至少一部分的可能来源。或者，一旦发现指纹之一具有在 922 满足匹配的门限的密钥集，则链接到那个指纹的来源被输出。
     在又一个实施例中，被插入分发副本的数据形式的 RMK 和 / 或一个或多个 KS 可用来标识媒体的来源。此外，嵌入的 RMK 和 / 或 KS 另外还可用于图 9 的上述识别过程来提高加指纹系统的健壮性。本发明的各种实现通过电子硬件、计算机软件或者这些技术的组合来实现。大部分实现包括由可编程计算机执行的一个或多个计算机程序。例如，在一个实现中，用于标识分发副本的系统包括实现上述标识过程的一种或多种计算机执行软件。在另一个实现中，用于给数据加指纹的系统可包括实现上述加指纹过程的一种或多种计算机执行软件。一般来说，每个计算机包括一个或多个处理器、一个或多个数据存储组件 ( 例如易失性或非易失性存储模块以及永久光和磁存储装置，诸如硬盘和软盘驱动器、 CD-ROM 驱动器以及磁带驱动器 )、一个或多个输入装置 ( 例如鼠标和键盘 ) 以及一个或多个输出装置 ( 例如显示控制台和打印机 )。
     计算机程序包括可执行代码，它们通常存储在永久存储媒体中，然后在运行时复制到存储器中。处理器通过以规定顺序从存储器中检索程序指令来执行代码。当执行程序代码时，计算机从输入和 / 或存储装置接收数据，对数据执行操作，然后把所得数据传递给输出和 / 或存储装置。
     虽然已经描述了本发明的各种说明性实现，但是本领域的普通技术人员会看到，其它实现也是可行的，并且落入本发明的范围之内。例如，虽然以上说明描述了为媒体数据 ( 例如电影 ) 加指纹的若干实现，但是在其它实现中，可采用其它类型的数据，例如可执行软件或科学数据。
     因此，本发明不是仅限于上述那些实现。

资源描述

《识别媒体来源的方法、加指纹的装置和系统.pdf》由会员分享，可在线阅读，更多相关《识别媒体来源的方法、加指纹的装置和系统.pdf（19页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102509031 A (43)申请公布日 2012.06.20 C N 1 0 2 5 0 9 0 3 1 A *CN102509031A* (21)申请号 201110276635.0 (22)申请日 2004.03.31 60/480687 2003.06.23 US 60/491763 2003.07.31 US 200480023708.3 2004.03.31 G06F 21/00(2006.01) (71)申请人索尼电影娱乐公司地址美国加利福尼亚州申请人索尼株式会社 (72)发明人 S马利克 R萨希 (74)专利代理机构北京东方亿思知识产权代理有限。

2、责任公司 11258 代理人宋鹤 (54) 发明名称识别媒体来源的方法、加指纹的装置和系统 (57) 摘要本发明涉及识别媒体来源的方法、加指纹的装置和系统。一种加指纹装置，包括：多个接收单元，接收多个输入数据集，多个输入数据集中的每个被分为多个输入段，多个输入数据集中至少一个被唯一地标记；选择器，从多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及至少一个组合器，排列所选的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于各输入数据集中的输入段的数量。 (30)优先权数据 (62)分案原申请数据 (51)Int.Cl. 权利要。

3、求书1页说明书9页附图8页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 1 页说明书 9 页附图 8 页 1/1页 2 1.一种加指纹装置，包括：用于接收多个输入数据集的部件，所述多个输入数据集中的每一个被分为多个输入段，所述多个输入数据集中的至少一个被唯一标记；用于从所述多个输入数据集中的至少两个不同的输入数据集的其中之一中选择至少一个输入段的部件；以及至少一个部件，用于排列所选择的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于每个输入数据集中的输入段的数量。 2.一种用于为媒体加指纹的加指纹系统，包括：用于接收分为。

4、多个媒体段的所述媒体的部件；用于标记分为多个媒体段的所述媒体并产生至少一个已标记媒体的部件，所述至少一个已标记媒体中的每一个被分为多个已标记媒体段；用于压缩分为多个媒体段的所述媒体以及至少一个已标记媒体的部件；用于从分为多个媒体段的所述媒体和至少一个已标记媒体的其中之一中选择至少一个分为多个媒体段的媒体或已标记媒体段的部件；以及至少一个部件，用于排列所选择的至少一个分为多个媒体段的媒体或已标记媒体段，从而产生具有多个已加指纹段的已加指纹媒体，使得已加指纹段的数量等于所述媒体中的媒体段的数量或者已标记媒体中的已标记媒体段的数量。权利要求书CN 102509031 A 1。

5、/9页 3 识别媒体来源的方法、加指纹的装置和系统 0001 本申请是申请日为2004年3月31日、申请号为200480023708.3、发明名称为“为数据加指纹”的发明专利申请的分案申请。相关申请的交叉引用 0002 这个申请要求2003年6月23日提交的标题为“采用已标记和未标记内容的伪随机组合为数据加指纹”、序号为60/480687的共同未决美国临时专利申请的优先权益。这个申请还要求2003年7月31日提交的标题为“为数据加指纹”、序号为60/491763的共同未决美国临时专利申请的优先权益。由此要求2003年6月23日和2003年7月31日的提交日期的优先权益，以及通过引用。

6、将这些临时专利申请的公开结合于此。技术领域 0003 本发明涉及识别媒体来源的方法，用于为媒体加指纹的加指纹系统或装置。背景技术 0004 因特网的迅速发展以及所产生的数字数据复制和散布的可能性导致对于防止这些非法活动以及使版权所有者免于与盗版副本关联的问题的方式的不断增长的需求。例如，未授权副本可能由数字数据的授权分发副本(例如商业副本)制成。通过比较给定的数字数据文档与未授权或非法散布的副本，水印能够为版权所有者提供该文档是版权所有者自己的知识产权的证明。为了压制、防止或禁止未授权副本的扩散，通过确定用来制作未授权副本的具体分发副本来了解未授权副本的来源往往是有用的。但是，可。

7、能难以采用加水印来识别用于产生未授权副本的分发副本。 0005 数字加水印可用来确定未授权或非法散布副本的来源。例如，当文档采用数字加水印来保护时，标识要接收文档的电子分发副本的顾客的标识符可通过察觉不到的方式与版权所有者的水印一起嵌入文档中。如果顾客违反版权所有者的利益而散布分发副本的副本，则可根据数字水印来识别该顾客，它将被包含在所有未授权或非法散布副本中。但是，当许多分发副本要合法地散布到许多不同顾客时，对每个分发副本分别进行数字加水印通常证明是不便且费时的。发明内容 0006 本发明提供用于实现为数据加指纹的方法及装置。在一个实现中，加指纹的方法包括：接收多个输入数据集。

8、，所述多个输入数据集中的每个被分为多个输入段，所述多个输入数据集中至少一个被唯一地标记；从所述多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及排列所述选择的至少一个输入段，从而产生具有多个输出段的输出数据集，使得输出段的数量等于各输入数据集中的输入段的数量。 0007 在另一个实现中，加指纹装置包括：多个接收单元，接收多个输入数据集，多个输入数据集中的每个被分为多个输入段，多个输入数据集中至少一个被唯一地标记；选择器，从多个输入数据集中的至少两个不同输入数据集其中之一中选择至少一个输入段；以及至少一个组合器，排列所选的至少一个输入段，从而产生具有多个输出段。

9、的输出数据集，使得说明书CN 102509031 A 2/9页 4 输出段的数量等于各输入数据集中的输入段的数量。 0008 在另一个实现中，用于为媒体加指纹的加指纹系统包括：接收器，接收分为多个媒体段的所述媒体；标记所述媒体的第一编码器，所述第一编码器产生至少一个已标记媒体，至少一个已标记媒体中的每个被分为多个已标记媒体段；第二编码器，比较所述媒体和至少一个已标记媒体；选择器，从所述媒体和至少一个已标记媒体其中之一中选择至少一个媒体或已标记媒体段；以及至少一个组合器，排列所选的至少一个媒体或已标记媒体段，从而产生具有多个加指纹段的加指纹媒体，使得加指纹段的数量等于各媒体或已标。

10、记媒体中的媒体或已标记媒体段的数量。 0009 在另一个实现中，识别媒体的来源的方法包括：接收所述媒体，并且识别经过排列而形成所述媒体的多个段；从多个段的排列中产生典型正本密钥(RMK)；接收指纹和链接到指纹的源；以及比较RMK与指纹。附图说明 0010 图1说明用于采用两个正本来产生加指纹内容的过程的实现。 0011 图2说明用于实现数据的加指纹的方法。 0012 图3说明把各有五个段的三个正本组合的表示。 0013 图4说明用于产生DVD封装媒体的加指纹过程的一种可能的实现。 0014 图5说明根据一种实现、用于产生DVD封装媒体的加指纹过程的另一种可能的实现。 0015 图6说。

11、明配置成处理输入正本的段的段重组器的详细示图。 0016 图7说明逐段组合两个媒体文件以产生下载媒体的唯一加指纹版本的一种实现。 0017 图8说明逐段组合两个媒体文件以产生视频点播内容的唯一加指纹版本的一种实现。 0018 图9说明根据采用RMK和KS的一种实现来识别媒体来源的一种方法。具体实施方式 0019 本公开描述在加指纹媒体生成和系统健壮性方面提供更高效率的系统及方法。 0020 在一种实现中，加指纹系统采用已标记和未标记内容的伪随机组合来提供数据的加指纹。已加指纹数据则可用来唯一识别内容使用争论。系统适用于各种类型的数据，例如视频和音频基本数据或复用流。系统还可应用于封装媒。

12、体，例如DVD和录像带、从因特网下载的内容和/或其它任何介质。 0021 图1说明用于采用第一正本100和第二正本102来产生已加指纹内容的过程的实现。在其它实现中，可采用不同数量的正本，例如三个或三个以上。该过程包括产生多个正本(m i )，其中下标i表示第i个正本。第一正本100是未标记的。第二正本102例如通过采用数字加水印技术来唯一标记。在具有三个或三个以上正本的另一种实现中，一个正本是未标记的，而其它正本中的每个被唯一地标记(例如，第二正本以不同于第三正本的方式来标记)。在另一种实现中，每个正本被唯一地标记。 0022 正本100、102则被分为n个部分或段。未标记正本1。

13、00中的各段为相同大小，并且具有与已标记正本102的相应段相同的内容(例如，正本100的段1与正本102的段1的说明书CN 102509031 A 3/9页 5 大小相同并且包括相同内容)。这样，副本104、106可通过伪随机组合来自不同正本100、 102的段来产生，下面进行描述。虽然未标记正本100的内容与已标记正本102的内容相同，但每个正本将具有不同的标记。例如，未标记正本100的第一段具有与已标记正本102 的第一段相同的内容，但是，未标记正本100的第一段没有被标记，而已标记正本102的第一段则被标记。因此，相应段中的基本信息是相同的，但是数据可能以不影响内容但允许段。

14、被区分的方式不同(在比较未标记和加水印数据时通常是这样的)。 0023 根据来自m个正本的n个相应段的组合的伪随机生成，产生正本的副本，它包括与正本相同的n个相应段，但各段取自伪随机选取的正本。这些段以伪随机方式来选取和组合(连接)，使得那n个段产生具有伪随机生成的段序列作为指纹的副本。副本的指纹标识副本中各段的源正本。因此，伪随机生成经过配置，使得可为各副本产生截然不同的指纹。多个伪随机数被产生，它伪随机地分配来自正本的段，使得截然不同的指纹可分配给所有副本，而没有重复段组合的模式。因此，所产生的伪随机数的数量必须等于或超过预期副本数量。 0024 在图2所示的流程图中说明一种用。

15、于实现上述数据加指纹的方法。在200接收多个正本，在其中，每个正本被分为多个段，以及每个正本被唯一地标记(例如数字加水印)。在一个实现中，一个正本保持未标记。正本中的第一段对应于其它正本中的每个的第一段。在一个实现中，各段因段中的相应标记(或没有标记)而可与其它正本的相应段区分开 (可确定那个段所属的正本)。在另一个实现中，不是所有的段都可与相应的段区分开。 0025 在202，选取来自至少两个不同正本之一的至少一个段。在204，则产生指纹。在一种实现中，指纹是伪随机数序列。在206，根据指纹来排列所选段，从而产生输出数据集，使得输出数据集中的段的数量等于每个正本中的段的数量。下面参。

16、照图3来描述选择和排列段的一个实例。在208，所产生的输出数据集存储在一种媒体产品、如封装介质中(例如烧录到CD或DVD上、复制到VHS磁带上)，从而产生分发副本。在210，指纹被链接到封装介质，以及链接被存储(例如指纹、标识特定媒体项的ID代码以及标识要接收该媒体项的顾客的ID代码存储在数据库表条目中)。 0026 伪随机数生成器确定要选取和排列段的模式。因此，生成器必须没有重复地产生足够多数量的伪随机数。在一个实现中，生成器产生数字，其中包括用于各段的一位，以及每位具有从1到正本数量的范围。各位对应副本中的某个段，以及位的值表明从哪个正本复制了该段。在另一种实现中，生成器产生。

17、适合于各段的数字作为一位，并把各位共同收集到模式中。 0027 例如，如图3所示，如果存在三个正本1、2和3，并且每个正本被分为五段，则伪随机数生成器产生五位数字，其中每位的值的范围为1至3，从而产生例如13213和22131 之类的数模式。这些伪随机数模式可用于分别产生副本1和副本2的段，其中数模式的各位表明源正本的段。 0028 例如，正本1的段由范围从1至5的数序列表示，正本2的段由范围从1至5的数序列表示，以及正本3的段由范围从1”至5”的数序列表示。在图3的所述实例中，伪随机数生成器已经把伪随机数序列13213分配给副本1，以及把伪随机数序列22131分配给副本2。这样，。

18、副本1的序列13213表明段1将从正本1中复制，段2将从正本3中复制，依次类推。因此，副本1的段可作为1-2”-3-4-5”来产生。副本2的段可类似地作为说明书CN 102509031 A 4/9页 6 1-2-3-4”-5来产生。各副本的伪随机数序列则可存储在数据库中，并且链接到请求该数据的特定用户和/或链接到存储数据的一种媒体产品。这些数据库条目可在后来用于源识别。 0029 为了提供对于已加指纹媒体生成的效率和系统健壮性的了解，可分析确定伪随机数序列的数量的因素。例如，可能的各个指纹的数量由三个因素来确定：正本数量(m)、正本中的段的数量(n)以及可交换的段的最小数量(k。

19、)。采用这些因素，组合的数量(c)可如下确定。 0030 如果多达n个段是可交换的，则组合的数量被确定为： 0031 0032 如果n中的多达k个段是可交换的，则组合的数量被确定为： 0033 0034 如果n中正好k个段是可交换的，则组合的数量被确定为： 0035 c(m-1) k . n C k 3 0036 其中 n C k ，表示n个中一次取k个的组合，而 n C k 则表示n个中一次取k个的组合。 0037 例如，如果对于120分钟的影片有两个正本(m2)，以及每个正本被分为60个段 (n60)并且60个段中只有20个段(k20)是可交换的，则利用等式2，唯一组合的数量被确定为4。

20、,191,844,505,805,495(超过4000万亿)。对于更简单的设置，假定有两个正本(m2)，每个正本具有20个段(n20)，以及全部20个段都是可交换的。利用等式 1，可能的组合的数量被确定为1,048,576。表1说明组合如何随着正本和段的数量来缩放(c的值对于较大数进行了近似)。 0038 m n c 2 20 1,048,576 3 20 3,486,784,401 5 20 95,367,431,640,625 10 20 100,000,000,000,000,000,000 2 10 1,024 2 20 1,048,576 2 60 1,152,921,504,6。

21、06,847,000 2 99 633,825,300,114,114,700,000,000,000,000 说明书CN 102509031 A 5/9页 7 0039 表1 0040 上述数据加指纹技术可应用于其中为传输而产生物理封装的各种不同的媒体。例如，数据的加指纹可应用于提交给奥斯卡评审员以便审查影片的DVD封装媒体(“奥斯卡筛选者” )、应用于从因特网下载的内容媒体或者应用于电缆传递的视频点播(VOD)。下面详细描述这些应用的每一个。其它应用包括家庭组网、定制随选CD/DVD编制、客户机端“烧录”到CD/DVD可记录媒体上以及其它相关媒体。此外，加指纹技术可移植到采用转。

22、换开关的模拟程序分块。 0041 来自奥斯卡筛选者媒体(例如DVD封装媒体或VHS磁带)的盗版问题得到理解和承认。已经提出的一种解决方案是分别标记(例如采用唯一水印)每一个发出的副本，使得电影被标记、编码以及分别“烧录”到各DVD上或者录制到VHS。但是，如上所述，采用不同水印分别标记各副本可能是非常繁重且费时的。 0042 图4说明分别标记DVD封装媒体的典型方法的一种可能实现。该过程以未标记视频文件400开始。要产生的所有DVD副本的标识符(ID)存储在数据库402中。 0043 视频文件400在水印编码器404中采用唯一ID加水印，从而产生已加水印视频文件406。唯一ID存储。

23、在数据库条目中。然后，已加水印视频文件406采用视频编码器408 进行编码，它产生压缩视频文件410。在一个实现中，视频编码器可配置为MPEG-2编码器。 0044 压缩视频文件410与压缩音频文件420在复用器412中组合，从而产生一个或多个组合视频-音频文件及元数据文件414。一个或多个组合视频-音频文件与元数据文件 414一起在DVD烧录器416中被烧录到DVD上，从而产生DVD副本418。标识特定DVD的ID 存储在那个DVD上的水印的唯一ID所用的数据库条目中。 0045 虽然依照产生分别标记的DVD副本来描述上述过程，但是应当理解，这个过程通常必须为待制作的预期数量(x)的DV。

24、D副本重复。因此，上述过程在技术上是可行的，但在实际上实现此过程是繁重且昂贵的。例如，对于2小时影片，水印编码器404的加水印过程通常可能耗用多达八小时。视频编码器408中的MPEG-2编码过程可能耗用多达两小时。复用器412中的音频-视频组合过程可能耗用多达大约30分钟，以及DVD烧录过程可能耗用多达另外30分钟。因此可以看到，每个DVD副本的产生可能耗用多达大约11个小时。虽然可部署附加资源并行创建分别标记的副本，但是对于大量的副本，并行性可能变得昂贵。 0046 图5说明用于产生DVD封装媒体的加指纹过程的一种实现。采用图5的实现，可显著加快产生DVD副本的过程。 0047 。

25、在图5的实现中，过程以视频正本500开始。然后产生视频正本500的两个副本 504。视频正本的第一副本504A未被标记，而第二副本504B则由水印编码器502加水印。特定加水印标识符(ID)用来对标记副本504B编码。在另一个实现中，可采用不同的标记过程。 0048 然后，视频正本的两个副本504A、504B分别采用视频编码器506A、506B来编码。视频编码器506A、506B分别产生压缩视频文件508A、508B。压缩视频文件508A未被标记，而压缩视频文件508B被标记。在一个实现中，视频编码器配置为MPEG-2编码器。 0049 压缩视频文件508A、508B与压缩音频文件52。

26、0分别在一对复用器510A、510B中被组合，从而分别产生组合视频-音频文件532A、532B。复用器510配置为以称作视频对象 (VOB)的段来处理压缩文件508。组合视频-音频文件532A是具有多个段的未标记DVD文说明书CN 102509031 A 6/9页 8 件。组合视频-音频文件532B是具有与未标记文件532A相同数量的段的已标记DVD文件。这样，DVD文件532A、532B在它们的关系方面实际上与图1所示的两个正本100、102之间的关系相似。下面详细描述VOB段。 0050 段重组器534A、534B采用两个正本DVD文件532A、532B来产生与图1所示的副本。

27、104、106相似的加指纹副本。每个段重组器534采用唯一标识符来重组(连接)每个正本 532的不同段。如上所述，各标识符由伪随机数生成器产生，并存储在数据库522中，以便标识每个副本和/或每种媒体的接收方。这样，图1实际上表示块530的一种实现的操作。 0051 然后，在段重组器534A、534B的输出上产生的已加指纹副本分别采用DVD烧录器 540A、540B烧录到DVD 542A、542B上。为了制作附加副本，来自未标记和已标记正本532A、 B的段的不同组合在重组器534A、B中任一个中被组合，然后被烧录到DVD上。由水印编码器502加水印、由编码器506编码以及由复用器510复用。

28、和处理没有对每个副本重复进行。因此，在图5的实现中，与图4的实现不同，重组器对段的重组以及到DVD的烧录被重复进行，以便产生预期数量(x)的DVD副本542，而不是重复整个过程中的每个步骤。这样，图5 所示的过程应当耗用实质上更少的时间，因为加水印仅对一个视频正本进行一次。因此，块 530和540所表示的过程应当对于每个DVD耗用不到一个小时。 0052 图6说明根据DVD特定的实现、配置成处理输入正本的段的段重组器534的详细示图。但是，图6所示的实现可扩展到其它封装媒体、如录像带。 0053 DVD段在某些预定的视频对象单元(VOBU)边界上产生，并分组为VOBU组。每个 VOBU组。

29、是独立的复用单元，并且没有与先前或以后单元的相关性。此外，VOBU由一个或多个图片组(GOP)构成。如DVD-VIDEO格式中定义的，VOBU可能是0.4至1.2秒长。VOBU组可能具有必需数量的VOBU。 0054 VOBU组被组合以形成VOB文件集。对于每个VOB文件集产生元数据(IFO)文件。元数据文件提供的细节之一是VOB文件集中的VOBU的偏移信息。对于最终用户，从这个 VOB重放看起来就像从任何常规DVD上的VOB重放。然而在内部，VOB是VOBU组的组合，各 VOBU组由从两个不同视频(MPEG-2)编码的部分复用的数据构成。这样，VOB遵循DVD规范限制，并且实质上是相。

30、符的。因此，如果这些DVD其中之一通过剖解或者通过重新编码被盗版(例如以如D i V x 或X vid 之类的格式)，则系统可通过分析视频流并定位其中存在已标记视频段的点来识别盗版副本的来源。系统可比较这些位置与烧录DVD时创建的、数据库服务器中存储的位置。各DVD对于已标记段具有唯一模式，因此各DVD被有效地“加指纹”。 0055 与图5所示的实现相似的一种实现可用来对于从因特网下载的内容媒体加指纹。在图7的所示实现700中，一个未标记702A和一个加水印702B的两个媒体文件被分为若干段，以及组合器704以唯一模式组合这些段，从而为每个下载产生内容的唯一加指纹版本。每个唯一组合。

31、采用标识符来产生，所述标识符由伪随机数生成器所产生，并且存储在数据库706中以标识加指纹副本。已加指纹副本通过万维网服务器708来存储或者流式传输，以便通过因特网710下载到客户PC 712。对于客户PC 712，重组/加指纹文件714表现为一个连续文件。客户不了解在万维网服务器708上发生的重组(即加指纹)。 0056 与图7的实现相似，VOD(视频点播)内容可加指纹，如图8所示。在这个实现中， VOD服务器从分为段的两个媒体文件、即一个未标记802A和一个加水印802B来创建加指纹文件。两个媒体文件802A、802B在组合器804中逐段被组合，从而对每个传递产生内容的说明书C。

32、N 102509031 A 7/9页 9 唯一加指纹版本。由于VOD媒体文件通常是经过分组化的MPEG-2传输流数据，这些文件是这种加指纹的优良候选者。 0057 在图8的所述实现中，两个媒体文件802A、802B在VOD服务器808中被组合。因此，所述情况称作单播情况，即数据在来源处被组合，然后被发送到特定目的地，其中目的地不了解其它分发副本。 0058 在另一个实现中(未示出)，卫星可向每个卫星接收器盒广播多个正本(即，向每个盒的多个正本的同时联播)。这种实现称作多播情况。在这种实现中，卫星接收器盒从服务器接收RMK信息，并且在把数据提供给TV之前执行组合。这样，在这种实现中，在。

33、VOD机顶盒812上发生组合。 0059 每个唯一组合采用由伪随机数生成器所产生并且存储在数据库806中以标识加指纹副本的标识符来产生。已加指纹副本通过电缆网络810被送到VOD机顶盒812。已加指纹副本经过处理并传递给客户TV 814。对于客户TV 814，重组/加指纹文件816表现为一个相连文件。客户不了解在VOD服务器808上发生的重组(即加指纹)。 0060 可执行数据的加指纹以为系统提供健壮性以及媒体来源识别的方法。具体来说，来自m个正本的n个段的组合的伪随机生成可有效地配置成提供对于通过采用多个或部分副本生成单一未授权副本来避开来源标识的企图的预防。在一个实现中，产生伪。

34、随机序列，使得来源可以仅采用未授权副本的一小部分来标识。在另一个实现中，对于基于组合多个来源的未授权副本，多个来源可通过相似方式来标识。 0061 在一个实现中，典型正本密钥(RMK)就来源标识而言用于系统的健壮性。RMK是构造(副本)的段的依次读出。如上所述，来自m个正本的n个段用来构建副本。读出包括 n位(对于n个段)，其中，每位的值的范围从1到m。位也可能具有X值，意味着它的值无关紧要(即“无关的”)。这样，具有从八个正本产生的十段的分发副本可能具有“1，4，2，5， X，6，X，1，6，2”的RMK。 0062 RMK也可被定义为元组的序列，在其中，各元组的形式是(x，y)。项。

35、x为段号 (从1到n依次改变)，以及项y为段值(值的范围从1到m，或者具有X值)。在这种情况中，上述RMK可写作“(1，1)(2，4)(3，2)(4，5)(5，X)(6，6)(7，X)(8，1)(9，6)(10，2)”。因此， RMK也可写作形式为(元组顺序，正本编号)的元组序列。 0063 制作具有不同指纹标识符的两个或两个以上分发副本的一种方法是为副本提供不同的RMK。这样，当被提供未知来源的副本时，系统可对副本的RMK进行解码或解密(例如，通过分析副本中的每个段的标记，以便确定那个段的源正本)，并从查找表/数据库确定那个副本的来源(例如原始分发的副本的接收方)。但是，如果未授权副。

36、本已经从多个分发副本或者从分发副本的一部分中产生，则未授权副本可能具有未在数据库中注册的RMK，或者具有注册为另一个顾客的RMK，它表明错误肯定标识。因此，如何构建RMK的决定在数据加指纹过程中可能是重要的。 0064 在一个实现中，RMK具有一个或多个密钥集(KS)。每个KS的长度范围从1到段的总数(n)，以及以元组列表的形式从RMK中读出，并以“元组顺序”的升序排列，如上所述。 RMK的不同KS可能是不同长度。这样，在一个实例中，KS可能是如下所示：KS1(2，4)(3， 2)(4，5)；KS2(1，1)(2，4)(6，6)(10，2)；KS3(1，1)(2，4)(3，2)(4，5。

37、)(5，X)(6，6)(7，X) (8，1)(9，6)(10，2)；KS4(4，5)；等等。当未知副本的RMK无法匹配查找表中列出的分发说明书CN 102509031 A 8/9页 10 副本的任一个的RMK时，系统可执行数学计算，以便确定未知副本的多少KS匹配查找表中的分发副本的KS。未知副本的源分发副本将被确定为提供高于所选门限值的KS匹配数量的分发副本。 0065 不同的KS可能具有不同的生成技术。为了确定KS的值，那个KS的生成技术应用于副本的RMK。例如，这些技术的一部分是比较简单的，使得对不同的RMK产生特定长度的 KS。在KS生成技术的一种实现中，如果KS4是第四元组。

38、，则对于RMK“(1，1)(2，4)(3，2) (4，5)(5，X)(6，6)(7，X)(8，1)(9，6)(10，2)”，KS4(4，5)。但是，对于另一个RMK，KS4可能是KS4(4，7)，等等。 0066 其它KS可具有更详细的生成过程。在KS生成技术的另一种实现中，KS12可能以具有RMK中存在的最高正本编号的最低顺序元组开始，之后跟随比第一个具有较低正本编号的较高顺序元组，之后跟随正本编号的降序中的下一个。对于RMK“(1，1)(2，4)(3，2) (4，5)(5，X)(6，6)(7，X)(8，1)(9，6)(10，2)”，由于当前的最高正本编号为6，因此在(6，6) 和(9。

39、，6)中，该过程选择(6，6)，因为它具有比(9，6)更低的顺序。所选的下一个元组将是具有比6更低的正本编号、但具有较高顺序的元组，这把过程引导到(10，2)。随后，不存在匹配集合规则的其它元组，因此过程以KS12(6，6)(10，2)结束。在KS12的情况中，KS的长度由于此过程的选择而不是固定的。 0067 上述过程只是可用于获得优良KS的许多可能性中的几个。因此，加指纹系统将具有RMK以及引用数据库中所存储的各分发副本的RMK的多个KS。给定未知来源的副本，系统获得未知副本的RMK。如果在数据库中没有RMK匹配，则系统产生那个RMK的KS。由于某些KS将在某些区域中定位，因此。

40、，存在系统能够识别可能产生那个特定RMK的来源的至少一部分的可能性。 0068 可以看到，上述KS生成技术可以相反地用于产生难以隐藏的优良RMK集合。RMK 集合可用来构建用于分发副本的一组伪随机数，使得副本包括难以隐藏的某些KS。 0069 存在其它方式来增加加指纹系统的健壮性。在一种实现中，数据形式的RMK和/ 或一个或多个KS可被插入分发副本本身中。在分发副本的生成时间中，插入可在不同位置以及在不同方面进行。这将允许系统识别未知副本，即使该副本具有分发副本的极小部分。如果那个小部分包括RMK的一个或多个部分和/或在任何方面插入的一个或多个KS数据，则未知副本可被识别为源自分发副本。

41、。 0070 在向加指纹系统提供健壮性的另一个实现中，在分发副本的生成时间中，伪数据可以数据形式在不同位置以及在不同方面被插入分发副本本身中。插入可以伪随机方式进行，以便阻止通过模式匹配两个或两个以上分发副本来避开指纹的企图。 0071 在又一个实现中，分发副本的某些或所有方面可采用RMK的标识符和/或一个或多个KS来标记。在这种情况中，即使副本从其它许多分发副本中重新制作，也可查询分发副本的所需方面，从而识别重新制作的副本的来源。 0072 图9说明根据采用RMK和KS的一种实现、识别媒体来源的一种方法。一开始，在 900接收要识别的媒体，以及识别经排列以形成媒体的段。然后，在902。

42、，从段的排列中产生典型正本密钥(RMK)。数据库存储所产生的分发副本的指纹以及链接到指纹、表明接收了与所链接指纹对应的分发副本的来源的标识符。在一个实现中，链接到指纹的来源可能是接收分发副本的人的名字。说明书CN 102509031 A 10 9/9页 11 0073 在906，从数据库接收指纹和链接到指纹的来源。RMK和指纹在906进行比较。如果比较产生匹配(即在908的“是”结果)，则在910输出所链接来源。否则，如果RMK与指纹之间的比较没有产生匹配(即在908的“否”结果)，则在912，从数据库接收下一个指纹和所链接来源。 0074 如果已经针对RMK检查了所有指纹，。

43、并且没有匹配，则在914，从RMK产生密钥集。这样，当RMK与指纹之间不存在匹配时，它表示所关注媒体可能不是完全从一个分发副本中复制的。因此产生密钥集，以便分析媒体的各部分，从而识别来源。 0075 在916，从数据库接收指纹和链接到指纹的来源。在918，从指纹产生密钥集。从 RMK产生的密钥集以及从指纹产生的密钥集在920进行比较。如果在922，密钥集之间匹配的数量超过某个门限值，则在924，链接到指纹的来源被记录。在926，从数据库接收下一个指纹和所链接来源，以及产生那个指纹的密钥集供比较，并返回到918。当所有指纹的密钥集已经与RMK的密钥集进行了比较，则在928输出在924记。

44、录的来源，作为在900所接收的媒体的至少一部分的可能来源。或者，一旦发现指纹之一具有在922满足匹配的门限的密钥集，则链接到那个指纹的来源被输出。 0076 在又一个实施例中，被插入分发副本的数据形式的RMK和/或一个或多个KS可用来标识媒体的来源。此外，嵌入的RMK和/或KS另外还可用于图9的上述识别过程来提高加指纹系统的健壮性。 0077 本发明的各种实现通过电子硬件、计算机软件或者这些技术的组合来实现。大部分实现包括由可编程计算机执行的一个或多个计算机程序。例如，在一个实现中，用于标识分发副本的系统包括实现上述标识过程的一种或多种计算机执行软件。在另一个实现中，用于给数据加。

45、指纹的系统可包括实现上述加指纹过程的一种或多种计算机执行软件。一般来说，每个计算机包括一个或多个处理器、一个或多个数据存储组件(例如易失性或非易失性存储模块以及永久光和磁存储装置，诸如硬盘和软盘驱动器、CD-ROM驱动器以及磁带驱动器)、一个或多个输入装置(例如鼠标和键盘)以及一个或多个输出装置(例如显示控制台和打印机)。 0078 计算机程序包括可执行代码，它们通常存储在永久存储媒体中，然后在运行时复制到存储器中。处理器通过以规定顺序从存储器中检索程序指令来执行代码。当执行程序代码时，计算机从输入和/或存储装置接收数据，对数据执行操作，然后把所得数据传递给输出和/或存储装置。。

46、0079 虽然已经描述了本发明的各种说明性实现，但是本领域的普通技术人员会看到，其它实现也是可行的，并且落入本发明的范围之内。例如，虽然以上说明描述了为媒体数据 (例如电影)加指纹的若干实现，但是在其它实现中，可采用其它类型的数据，例如可执行软件或科学数据。 0080 因此，本发明不是仅限于上述那些实现。说明书CN 102509031 A 11 1/8页 12 图1 说明书附图CN 102509031 A 12 2/8页 13 图2 说明书附图CN 102509031 A 13 3/8页 14 图3 说明书附图CN 102509031 A 14 4/8页 15 图4 图5 说明书附图CN 102509031 A 15 5/8页 16 图6 说明书附图CN 102509031 A 16 6/8页 17 图7 说明书附图CN 102509031 A 17 7/8页 18 图8 说明书附图CN 102509031 A 18 8/8页 19 图9 说明书附图CN 102509031 A 19 。

展开阅读全文