音频水印.pdf

摘要
申请专利号：	CN201280024995.4	申请日：	2012.06.11
公开号：	CN103548079A	公开日：	2014.01.29
当前法律状态：	授权	有效性：	有权
法律详情：	专利权人的姓名或者名称、地址的变更 IPC(主分类):G10L 19/018变更事项:专利权人变更前:恩德斯有限公司变更后:西娜媒体有限公司变更事项:地址变更前:英国米德尔塞克斯郡变更后:英国米德尔塞克斯郡\|\|\|专利权人的姓名或者名称、地址的变更IPC(主分类):G10L 19/018变更事项:专利权人变更前:NDS有限公司变更后:恩德斯有限公司变更事项:地址变更前:英国米德尔塞克斯郡变更后:英国米德尔塞克斯郡\|\|\|授权\|\|\|实质审查的生效IPC(主分类):G10L 19/018申请日:20120611\|\|\|公开
IPC分类号：	G10L19/018(2013.01)I; G10L25/90(2013.01)N	主分类号：	G10L19/018
申请人：	NDS有限公司
发明人：	泽夫·盖泽尔
地址：	英国米德尔塞克斯郡
优先权：	2011.08.03 US 61/574,440
专利代理机构：	北京博浩百睿知识产权代理有限责任公司 11134	代理人：	宋子良;张奇巧
PDF下载：	PDF下载

内容摘要

一种系统，包括处理器，用于确定用于将水印编码到具有分段的音频流中的时机，当在频域中被表示时，每个分段包括幅度相对于频率的信号，所述处理器可操作为针对每个分段识别基频f，该基频f是在一个分段中具有信号的最大幅度的频率，基频f确定谐波频率，每个谐波频率位于频率f/2n或2fn处，n是正整数，以及若一个分段的信号的幅度对于在一个或多个不同频率范围内的所有频率来说小于值v，则将这一分段确定为用于编码至少部分水印的时机，每个不同的频率范围在以不同的一个谐波频率为中心的周围。还描述了相关的设备和方法。

权利要求书

权利要求书
1.  一种系统，包括处理器，用于确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号，所述处理器针对所述音频流的每一个所述分段可操作为：
识别一个分段的基频f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处，n为正整数；以及
若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。

2.  根据权利要求1所述的系统，其中，所述值v小于或等于所述信号在所述一个分段的所述基频处的幅度的25%。

3.  根据权利要求1或权利要求2所述的系统，其中，每个所述不同频率范围的大小分别等于每个所述不同频率范围的中心处的频率的6%。

4.  根据权利要求1至3中任一项所述的系统，其中，所述谐波频率在从20Hz到20,000Hz的频率范围内。

5.  根据权利要求1至4中任一项所述的系统，其中，所述处理器可操作为准备用于传输至另一装置的数据，所述数据包括：在频域或时域中格式化的所述音频流；以及标示所确定的时机的信息。

6.  根据权利要求5所述的系统，进一步包括用于将所述数据传输至所述另一装置的传输设备。

7.  根据权利要求5或权利要求6所述的系统，其中，所述处理器可操作为针对所述音频流的被确定为所述时机之一的每一个所述分段准备所述数据以便包括：所述一个分段的定时信息；在所述一个分段的所述基频处的所述信号的幅度；所述一个分段的一个或多个不同的所述谐波频率。

8.  根据权利要求5至7中任一项所述的系统，其中，所述处理器可操作为准备所述数据以包括确定已被确定为用于编码所述水印的一个所述时机的多对所述分段的数据。

9.  根据权利要求1至8中任一项所述的系统，进一步包括水印编码器，用于将所述水印编码到所述音频流中，所述编码包括将音频添加至被确定为编码时机的至少一些所述分段，所添加的音频被添加成使得对于每一所确定的分段，所添加的音频被添加至每个所述不同频率范围或一个所述不同频率范围中的某处。

10.  根据权利要求9所述的系统，其中，所添加的音频具有等于所述信号在所述一个分段的所述基频处的幅度的25%的最大幅度。

11.  一种方法，包括：
确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号；以及
针对所述音频流的每一个所述分段：
识别一个分段的基频f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处，n为正整数；以及
若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。

说明书

说明书音频水印
技术领域
本发明涉及音频水印。
背景技术
通过介绍，水印可用于检测非法分布的内容并判定非法分布的来源。
认为以下参考文献能代表本技术的现状。
Hoguchi的美国公开专利申请2006/0048633；
Petrovic等的美国公开专利申请2006/0239501；
明治大学的日本公开专利申请2005049409；以及
首尔工业合作基金大学的韩国公开专利申请20090093530。
发明内容
在本发明的某些实施方式中，本发明力图提供一种改进的音频水印系统。
通过介绍，当一个音符分成两个八度音阶同时播放时，对大多数听众来说，这两个音符听起来基本上是一样的。在下一个（较高）八度音阶中的同样的音符是当前音符的频率的两倍，在先前的（较低）八度音阶中，同样的音符是当前音符的频率的一半。在不同的八度音阶中，谐波是相同的音符。
在本发明的实施方式中，本发明包括一种水印系统，该水印系统用于将水印数据在或接近于音频内容项的不同分段的一个或多个谐波频率处编码，从而减小嵌入的音频水印对听众的听觉的干扰。
具体地，该水印系统包括通过分析音频内容的各个分段的组成频率来识别用于将音频水印编码在音频内容中的合适的编码时机（opportunity，机会）。
因此，根据本发明的实施方式提供了一种系统，所述系统包括：处理器，用于确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号，所述处理器针对所述音频流的每一个所述分段可操作为：识别一个分段的基频f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处，n为正整数；以及若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。
进一步地，根据本发明的实施方式，所述值v小于或等于所述信号在所述一个分段的所述基频处的所述幅度的25%。
更近一步地，根据本发明的实施方式，每个所述不同频率范围的大小分别等于每个所述不同频率范围的中心处的频率的6%。
另外，根据本发明的实施方式，所述谐波频率在从20Hz到20,000Hz的频率范围内。
此外，根据本发明的实施方式，所述处理器可操作为准备用于传输至另一装置的数据，所述数据包括：在频域或时域中格式化的所述音频流；以及标示所确定的时机的信息。
进一步地，根据本发明的实施方式，所述系统包括用于将所述数据传输至所述另一装置的传输设备。
更进一步地，根据本发明的实施方式，所述处理器可操作为针对所述音频流的被确定为所述时机之一的每一个所述分段准备所述数据以便包括：所述一个分段的定时信息；在所述一个分段的所述基频处的所述信号的幅度；所述一个分段的一个或多个不同的所述谐波频率。
另外，根据本发明的实施方式，所述处理器可操作为准备所述数据以包括确定已被确定为用于编码所述水印的一个所述时机的多对所述分段的数据。
此外，根据本发明的实施方式，所述系统包括水印编码器，用于将所述水印编码到所述音频流中，所述编码包括将音频添加至被确定为编码时机的至少一些所述分段，所添加的音频被添加成使得对于每一所确定的分段，所添加的音频被添加至每个所述不同频率范围或一个所述不同频率范围中的某处。
进一步地，根据本发明的实施方式，所添加的音频具有等于所述信号在所述一个分段的所述基频处的所述幅度的25%的最大幅度。
根据本发明的又一实施方式，还提供了一种方法，所述方法包括确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号；以及针对所述音频流的每一个所述分段：识别一个分段的基频f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处，n为正整数；以及若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。
附图说明
结合附图，从以下详细描述中将更充分地理解并领会本发明，在附图中：
图1是根据本发明的实施方式构造和操作的水印系统的部分图示的部分框图示图；
图2是示出在图1的系统中识别水印编码时机的示图；
图3是示出在图1的系统中编码部分水印之后的分段的示图；
图4是示出图1的系统中的第一编码方法的图表；以及
图5是示出图1的系统中的第二编码方法的图表。
具体实施方式
遍及本说明书和权利要求书，术语“编码”以其所有的语法形式被用以指代任何类型的数据流编码，该数据流编码包括例如（但并不限制定义的范围）熟知的编码类型，诸如但不限于，MPEG-2编码、H.264编码、VC-1编码以及诸如可缩放矢量图形（SVG）和LASER（ISO/IEC14496-20）的合成编码等。应理解，相比未被编码的数据流，编码的数据流通常需要更多的处理并且通常需要更多的时间来读取。编码数据的任何接收器至少在不需要密码分析的情况下潜在的能够读取编码数据，而不管编码数据的接收器是否为预期的接收器。应理解可分几个步骤进行编码并可包括大量不同的处理，包括但无需限于：压缩数据；将数据转换为其他形式；以及使数据更强健（例如，复制数据或使用纠错机制）。
遍及本说明书及权利要求书，术语“压缩”以其所有的语法形式被用以指代任何类型的数据流压缩。压缩通常是编码的一部分并且可包括图像压缩和移动补偿。通常，数据的压缩减少了包含数据的比特的数量。由于压缩是编码的子集，所以遍及本说明书和权利要求书，术语“编码”和“压缩”以它们所有的语法形式经常被交替使用。
类似地，遍及本说明书和权利要求书，术语“解码”和“解压”以它们所有的语法形式被用以指代所有语法形式的“编码”和“压缩”的反面。
遍及本说明书和权利要求书，术语“加扰”和“加密”以它们所有的语法形式被交替使用以指代用于加扰和/或加密数据流的任何合适的加扰和/或加密方法，和/或用于旨在使数据流很难理解（除了对其预期的接收器）的任何其他合适的方法。熟知的加扰或加密类型包括但不限于DES、3DES以及AES。类似地，遍及本说明书和权利要求书，术语“解扰”和“解密”以它们所有的语法形式被用以指代所有语法形式的“加扰”和“加密”的反面。
依据上述定义，术语“编码”、“压缩”以及术语“加扰”和“加密”用于指代不同的专有类型的处理。因而，特定的数据流可以是，例如：
编码的，但既不加扰也不加密的；
压缩的，但既不加扰也不加密的；
加扰的或加密的，但未被编码的；
加扰的或加密的，但未被压缩的；
编码的和加扰的或加密的；或者
压缩的和加扰的或加密的。
同样地，一方面术语“解码”和“解压”，以及另一方面术语“解扰”和“解密”被用于指代不同的专有类型的处理。
现参照图1，它是根据本发明的实施方式构造和操作的水印系统10的部分图示的部分框图的示图。
介绍一下，当一个音符以两个八度音阶同时播放时，对大多数听众来说，这两个音符听起来基本上是一样的。在下一个（较高）八度音阶中的同样的音符是当前音符的频率的两倍，在先前的（较低）八度音阶中，同样的音符是当前音符的频率的一半。在不同的八度音阶中，谐波是相同的音符。
水印系统10可操作为利用不同声音之间的相似性来将水印数据14在或接近于音频流12的不同分段的一个或多个谐波频率处编码，从而减小嵌入的音频水印对听众的听觉的干扰。
具体地，水印系统10包括通过分析音频流12的各个分段的组成频率来识别用于将音频水印14编码在音频流12中的合适的编码时机。
现将更详细地描述水印系统10。
水印系统10通常包括内容服务器16和多个渲染装置18（为简便起见，只示出了一个）。
内容服务器16通常包括处理器20和传输设备22。
处理器20通常可操作为确定用于将水印14编码至音频流12中的多个时机。该时机标示音频流12的哪个分段适合于将水印14编码在其中。处理器20通常可操作为准备用于传输至渲染装置18的数据24。数据24通常包括在频域或时域中格式化的音频流12以及标示所确定的时机26的信息。参照图2更详细地描述标示所确定的时机26的信息。
传输设备22通常可操作为将数据24传输至渲染装置18。可以使用任何合适的通信方法（例如但不限于，卫星、电缆、网络协议、地面或蜂窝通信系统或其任何合适的组合）来传输数据24。
每个渲染装置18通常包括接收器28和水印编码器30。每个渲染装置18也可包括其他合适的元件，例如但不限于，内容播放器和合适的驱动器。可从任何合适的渲染装置（例如但不限于，机顶盒、适当配置的计算机和移动装置）中选择渲染装置18。
接收器28通常可操作为从内容服务器16接收数据24。
每个渲染装置18通常与标示渲染装置18和/或渲染装置18的使用者/用户的身份标识32有关。身份标识32可部分或全部设置于安全芯片（诸如SIM卡或智能卡）中，该安全芯片可被设置于渲染装置18中或可拆卸地安插于渲染装置18中。水印编码器30通常可操作为确定水印数据14从而使至少部分水印数据14通常基于至少部分身份标识32。作为通过水印编码器30形成水印数据14的处理的一部分，可使用任何合适密码散列（hash）打乱至少一些身份标识32。
水印编码器30通常可操作为基于接收到的标示所确定的时机的信息26将水印14编码至音频流12中（框34）。换言之，水印数据14只在音频流12的被确定为编码时机的那些分段中进行编码。
图1示出了确定时机的处理器20以及将标示所确定的时机的信息26发送至渲染装置18以用于编码的传输设备22。
在内容服务器16中确定时机以及在渲染装置18中编码音频流12至少因以下原因是有利的。首先，渲染装置18可能不具有确定时机所需的处理能力。第二，由于内容服务器16已经知道时机的位置，所以在内容服务器16中标示时机可提高水印数据14的后续识别，即使是在噪声环境下。
本领域普通技术人员将会理解，必要时，也可在渲染装置18中确定时机和编码水印数据14。
现参照图2，它是示出在图1的系统10中识别水印编码时机的示图。
音频流12具有多个分段38，例如但不限于，音频帧。当在频域中表示时，每个分段38包括幅度42相对于频率44的信号40。在图2中信号40被示出为一系列垂直线，其为图2中的最粗的线。为简便起见，只标记了信号40的某些垂直线。每个分段38可具有任何合适的持续时间，例如但不限于，30毫秒和100毫秒之间。
若音频流12在其到达处理器20（图1）时尚未被分成分段38，则处理器20通常可操作为将音频流12划分成分段38。
类似地，若音频流12不是在频域中表示，则处理器20（图1）执行变换（诸如傅里叶变换）以产生音频流12的每个分段38的频域表示。
应注意，MPEG编码的音频通常被编码为分段38的傅里叶变换，且因此针对合适的编码时机来分析MPEG音频帧通常需要较少的处理。
处理器20（图1）可操作为分析分段38的频域表示以识别用于编码水印数据14（图1）的良好候选。
现更详细地描述确定编码时机。
处理器20（图1）通常可操作为识别音频流12的每个分段38的基频46，f。每个分段38的基频46是具有信号40的最大幅度的频率。每个分段38的基频f确定多个谐波频率48。每个谐波频率48位于频率f/2n或2fn处，n是正整数。谐波频率48通常在从20Hz至20,000Hz的频率范围内。
若任一分段38的信号40的幅度对于在多个不同频率范围50中的一个或多个不同频率范围中的所有频率来说小于一值v，则处理器20（图1）通常可操作为将该分段38确定为用于编码至少部分水印14（图1）的时机。每个不同频率范围50在以该分段38的不同谐波频率48为中心的周围。因此例如，一个频率范围50可在以f/2为中心的周围，并且另一个频率范围50可在以2f为中心的周围。
仅举例来说，可以依据由内容供应商或广播公司所选的编码标准将水印数据14（图1）编码在一个频率范围50中或多个频率范围50中。因此，处理器20（图1）将依据编码标准检查一个频率范围50或多个频率范围50来看信号40是否小于值v。举例来说，处理器20可寻找其中信号40在以频率f/2为中心的周围的频率范围50中总是低于值v的分段38。可替代地，处理器20可寻找其中信号40在以频率f/2为中心的周围的频率范围50和以频率2f为中心的周围的频率范围这两者中总是低于值v的分段38，且因此，只有其中信号40在以频率f/2和2f两者为中心的周围的频率范围50中总是低于值v的那些分段38将会被选择为时机。
现在进行关于值v的选择的讨论。
为了将水印数据14从音频流12中去除，渲染装置18（图1）的用户可决定记录音频流12并随后回放具有编码在其中的水印数据14（图1）的音频流12以用于输出至另一装置。另一装置可随后对所接收到的音频流12再编码。若水印数据14的编码不是用足够大的幅度来编码的，则通过另一装置对音频流12的再编码可以掩盖该编码。因此，通过水印编码器30（图1）的水印编码需要足够大以防止被掩盖，但还要足够小以便不干扰听众。发明人提出通过添加幅度近似等于基频46幅度的四分之一的音频来对所选择的时机进行编码。然而，所添加的音频的精确幅度可以依据你不想干扰的听众的类型和你想保护以对抗的再编码算法以及其他可能的因素。
要考虑的另一个因素是在编码水印数据14（图1）后的分段38的相关频率范围50中的信号40的幅度需要足够小以使该分段的基频46不会被淹没（这可能严重改变声音）。
因此，考虑到上述要求，为了决定是否在特定分段38（即，该分段38为时机）中编码部分水印数据14，可能用于在其中编码部分水印数据14的可用频率范围50需要具有足够富余的幅度，使得可添加更多的用于编码的音频。发明人提出值v通常等于b/4，其中，b是该分段38的基频46的幅度。
每个不同的频率范围50的大小通常分别等于在每个不同频率范围50的中心处的频率48的6%。因此例如，若在频率范围50中心处的谐波频率48具有500Hz的频率，则频率范围50是500Hz的6%（其等于30Hz）。因此，频率范围50从470Hz延伸至530Hz。发明人提出值6%是因为它通常是两个相邻音符之间的步幅。
图2示出针对音频流12的两个分段38（即，分段52和分段54）的信号40。
将首先假定编码标准要求水印编码发生在谐波频率48，f/2和2f两者周围并且v等于b/4来分析分段52、54。
分段52表示在以频率f/2为中心的周围的频率范围50中信号40的幅度为0并且在以频率2f为中心的周围的频率范围50中的信号40包括信号40的两个部分（部分56和部分58）。两个部分56、58都低于b/4。因此，分段52将被选择为编码时机。
关于分段54，在以频率f/2为中心的周围的频率范围50中，信号40的幅度为0，并且在以频率2f为中心的周围的频率范围50中，信号40包括信号40的两个部分（部分60和部分62）。部分60具有小于b/4的幅度，但部分62具有大于b/4的幅度。因此，分段52将不会被选择为编码时机。
若假定编码标准要求水印编码只出现在谐波频率f/2处或其附近并且v等于b/4来分析分段52、54，则分段52、54都将被选为编码时机。
对于由处理器20（图1）确定为编码时机的每个分段38，处理器20通常可操作为准备标示所确定的时机的信息26（图1），该信息26包括：相关分段38的定时信息；在相关分段38的基频46处的信号40的幅度（因为为了编码部分水印数据14（图1）而被添加至信号40的音频的幅度可被确定为基频46的一部分）；以及编码将发生在相关分段38中的一个或多个谐波频率48或者将能够计算谐波频率48的基频46的频率。
根据本发明的实施方式，对水印数据14（图1）的一个比特的编码基于其中编码时机是成对的两个编码时机。参照图5更详细地描述该编码方法。因此，根据该实施方式，处理器20（图1）可操作为准备标示所确定的时机的信息26（图1）以包括确定被确定为编码水印14的时机的多对分段38的数据。
现参照图3，它是示出在图1的系统10中编码部分水印数据14（图1）之后的图2的分段52的示图。
水印编码器30（图1）通常可操作为基于接收到的标示所确定的时机的信息26（图1）将水印14编码至音频流12（图2）中。编码通常包括将音频64添加至被确定为编码时机的至少一些分段38。根据编码标准，所添加的音频64通常被添加成使得对于每个分段38（确定为时机），所添加的音频64被添加至每个不同频率范围50或一个频率范围50中的某处。尽管所添加的音频64可被添加至所选择的频率范围中的任意位置，但为了最小化对听众的干扰，音频64通常被添加至尽可能地接近谐波频率48。
对于每个被编码的分段38，所添加的音频64通常具有等于该分段38的基频46处的信号40的幅度的25%的最大幅度。
通常通过修改每个相关分段38的信号40来添加音频64。换言之，音频64被添加在频域中，例如，通过为每个音频帧修改MPEG编码的音频数据来添加。
若渲染装置18（图1）没有权限访问频域中的音频流12（图2）的数据，则渲染装置18可基于标示被确定的时机的信息26（图1）在特定频率特定时间处生成声音。
现参照图4，它是示出图1的系统10中的第一编码方法的图表。同样也参照图3。
水印数据14可表示为比特流，一系列“0”和“1”。比特流中的每个比特通常被编码在被选为编码时机的不同的分段38中。
图4示出了十二个分段38。在这十二个分段中，分段1、4-6、10和12被确定为编码时机。
通过在谐波频率或频率48（根据编码标准，例如在频率f/2和/或2f）处添加音频64来将“1”编码在一个分段38中。通过不添加音频64来将 “0”编码在一个分段38中。如此，各个“1”和“0”可被编码在编码时机中。
因此对于分段1、5、6和12，通过添加音频64（图3）来编码“1”。对于分段4和10，通过不添加音频来编码“0”。
该编码法可能会导致错误，由此出现“0”事实上是编码错误，诸如“1”被错误地编码或跳过。
此外，由于不可能或很难知道它是否是容易跳过的时机或者它是否是0，通常不可能随机跳过时机，除非跳过时机是编码方法的一部分。
现参照图5，它是示出图1的系统10中第二编码方法的图表。同样也参照图3。
图5示出了十二个分段38。在这十二个分段38中，分段1、4-6、8-10和12被确定为编码时机。
此外，为了编码的目的而将时机配对。
图5示出了形成一对的分段1和分段4、形成一对的分段5和分段6、形成一对的分段8和分段9以及形成一对的分段10和分段12。
通过在谐波频率或频率48（根据编码标准，例如在频率f/2和/或2f）处添加音频64来将“1”编码在一对分段38中的第一分段38内。
通过在谐波频率或频率48（根据编码标准，例如在频率f/2和/或2f）处添加音频64来将“0”编码在一对分段38中的第二分段38内。
因此为了编码“1”而将音频64添加至分段1而不是分段4中。为了编码“0”而将音频64添加至分段9而不是分段8中。
音频64已被添加至分段5和分段6两者中。因此，包括分段5和6的一对的编码是无效的。音频64未被添加至分段10或分段12中。因此，包括分段10和12的一对的编码被跳过。
为防止对嵌入在音频流12中的水印数据14的检测，老道的黑客可以决定通过一个或更多的八度音阶来增加或减少音频频率。使用对数仍可检测出这一变化。若初始频率是F且篡改频率是m×F（m取决于音频被偏移了多少个八度音阶），则log（mF）在算数上等于log m加上log F。初始信号被偏移了确定的数量，且因此可检测出篡改。
实际上，某些或全部的这些功能可被结合在单个物理部件中，或者可替代地，使用多个物理部件来实施。这些物理部件可包括硬连线或可编程装置或这两者的结合。在某些实施方式中，至少某些处理电路的功能可以在合适的软件控制下通过可编程处理器来执行。例如，该软件可以电子形式通过网络下载至装置26。可替代地或额外地，软件可以存储在有形的、非暂时性的计算机可读存储介质中，诸如光存储器、磁存储器或电子存储器。
应当理解，如果需要的话，本发明的软件部件可以ROM（只读存储器）形式来实施。如果需要的话，软件部件可通常使用常规技术在硬件中实施。应进一步理解，软件部件例如可示例为计算机程序产品；在有形的介质上；或可由合适的计算机解译的信号。
将理解，为清晰起见，在单独的实施方式的上下文中描述的本发明的各个特征也可在单个实施方式中以组合的形式来提供。相反，为简便起见，在单个实施方式的上下文中描述的本发明的各个特征也可单独地或者以任何适合的子组合来提供。
本领域技术人员将理解，本发明不由上文具体示出和描述的内容来限制。而是由所附权利要求及其等价物来限定本发明的范围。

资源描述

《音频水印.pdf》由会员分享，可在线阅读，更多相关《音频水印.pdf（14页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 103548079 A (43)申请公布日 2014.01.29 CN 103548079 A (21)申请号 201280024995.4 (22)申请日 2012.06.11 61/574,440 2011.08.03 US G10L 19/018(2013.01) G10L 25/90(2013.01) (71)申请人 NDS 有限公司地址英国米德尔塞克斯郡 (72)发明人泽夫盖泽尔 (74)专利代理机构北京博浩百睿知识产权代理有限责任公司 11134 代理人宋子良张奇巧 (54) 发明名称音频水印 (57) 摘要一种系统，包括处理器，用于。

2、确定用于将水印编码到具有分段的音频流中的时机，当在频域中被表示时，每个分段包括幅度相对于频率的信号，所述处理器可操作为针对每个分段识别基频 f，该基频 f 是在一个分段中具有信号的最大幅度的频率，基频 f 确定谐波频率，每个谐波频率位于频率 f/2n 或 2fn 处， n 是正整数，以及若一个分段的信号的幅度对于在一个或多个不同频率范围内的所有频率来说小于值 v，则将这一分段确定为用于编码至少部分水印的时机，每个不同的频率范围在以不同的一个谐波频率为中心的周围。还描述了相关的设备和方法。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2013.1。

3、1.22 (86)PCT国际申请的申请数据 PCT/IB2012/052937 2012.06.11 (87)PCT国际申请的公布数据 WO2013/017966 EN 2013.02.07 (51)Int.Cl. 权利要求书 2 页说明书 8 页附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书2页说明书8页附图3页 (10)申请公布号 CN 103548079 A CN 103548079 A 1/2 页 2 1. 一种系统，包括处理器，用于确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段。

4、包括幅度相对于频率的信号，所述处理器针对所述音频流的每一个所述分段可操作为：识别一个分段的基频 f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处， n为正整数；以及若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值 v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。 2.根据权利要求1所述的系统，其中，所述值v小于或等于所述信号在所述一个分段的所述基频处的幅度的 25%。 3.根据。

5、权利要求1或权利要求2所述的系统，其中，每个所述不同频率范围的大小分别等于每个所述不同频率范围的中心处的频率的 6%。 4. 根据权利要求 1 至 3 中任一项所述的系统，其中，所述谐波频率在从 20Hz 到 20,000Hz 的频率范围内。 5.根据权利要求1至4中任一项所述的系统，其中，所述处理器可操作为准备用于传输至另一装置的数据，所述数据包括：在频域或时域中格式化的所述音频流；以及标示所确定的时机的信息。 6. 根据权利要求 5 所述的系统，进一步包括用于将所述数据传输至所述另一装置的传输设备。 7.根据权利要求5或权利要求6所述的系统，其中，所述处。

6、理器可操作为针对所述音频流的被确定为所述时机之一的每一个所述分段准备所述数据以便包括：所述一个分段的定时信息；在所述一个分段的所述基频处的所述信号的幅度；所述一个分段的一个或多个不同的所述谐波频率。 8.根据权利要求5至7中任一项所述的系统，其中，所述处理器可操作为准备所述数据以包括确定已被确定为用于编码所述水印的一个所述时机的多对所述分段的数据。 9. 根据权利要求 1 至 8 中任一项所述的系统，进一步包括水印编码器，用于将所述水印编码到所述音频流中，所述编码包括将音频添加至被确定为编码时机的至少一些所述分段，所添加的音频被添加成使得对于每一所确定的分段。

7、，所添加的音频被添加至每个所述不同频率范围或一个所述不同频率范围中的某处。 10. 根据权利要求 9 所述的系统，其中，所添加的音频具有等于所述信号在所述一个分段的所述基频处的幅度的 25% 的最大幅度。 11. 一种方法，包括：确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号；以及针对所述音频流的每一个所述分段：识别一个分段的基频 f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频f确定多个谐波频率，每个所述谐波频率位于频率f/2n或2fn处， n为正整数；。

8、以及权利要求书 CN 103548079 A 2 2/2 页 3 若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值 v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。权利要求书 CN 103548079 A 3 1/8 页 4 音频水印技术领域 0001 本发明涉及音频水印。背景技术 0002 通过介绍，水印可用于检测非法分布的内容并判定非法分布的来源。 0003 认为以下参考文献能代表本技术的现状。 0004 Hoguchi 的美国公开专利申请 2006/00。

9、48633 ； 0005 Petrovic 等的美国公开专利申请 2006/0239501 ； 0006 明治大学的日本公开专利申请 2005049409 ；以及 0007 首尔工业合作基金大学的韩国公开专利申请 20090093530。发明内容 0008 在本发明的某些实施方式中，本发明力图提供一种改进的音频水印系统。 0009 通过介绍，当一个音符分成两个八度音阶同时播放时，对大多数听众来说，这两个音符听起来基本上是一样的。在下一个（较高）八度音阶中的同样的音符是当前音符的频率的两倍，在先前的（较低）八度音阶中，同样的音符是当前音符的频率的一半。在不同的八度音。

10、阶中，谐波是相同的音符。 0010 在本发明的实施方式中，本发明包括一种水印系统，该水印系统用于将水印数据在或接近于音频内容项的不同分段的一个或多个谐波频率处编码，从而减小嵌入的音频水印对听众的听觉的干扰。 0011 具体地，该水印系统包括通过分析音频内容的各个分段的组成频率来识别用于将音频水印编码在音频内容中的合适的编码时机（opportunity，机会）。 0012 因此，根据本发明的实施方式提供了一种系统，所述系统包括：处理器，用于确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信。

11、号，所述处理器针对所述音频流的每一个所述分段可操作为：识别一个分段的基频 f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频 f 确定多个谐波频率，每个所述谐波频率位于频率 f/2n 或 2fn 处， n 为正整数；以及若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值 v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。 0013 进一步地，根据本发明的实施方式，所述值 v 小于或等于所述信号在所述一个分段的所述基频处的所述幅度的 25%。 00。

12、14 更近一步地，根据本发明的实施方式，每个所述不同频率范围的大小分别等于每个所述不同频率范围的中心处的频率的 6%。 0015 另外，根据本发明的实施方式，所述谐波频率在从 20Hz 到 20,000Hz 的频率范围内。说明书 CN 103548079 A 4 2/8 页 5 0016 此外，根据本发明的实施方式，所述处理器可操作为准备用于传输至另一装置的数据，所述数据包括：在频域或时域中格式化的所述音频流；以及标示所确定的时机的信息。 0017 进一步地，根据本发明的实施方式，所述系统包括用于将所述数据传输至所述另一装置的传输设备。 0018 更进。

13、一步地，根据本发明的实施方式，所述处理器可操作为针对所述音频流的被确定为所述时机之一的每一个所述分段准备所述数据以便包括：所述一个分段的定时信息；在所述一个分段的所述基频处的所述信号的幅度；所述一个分段的一个或多个不同的所述谐波频率。 0019 另外，根据本发明的实施方式，所述处理器可操作为准备所述数据以包括确定已被确定为用于编码所述水印的一个所述时机的多对所述分段的数据。 0020 此外，根据本发明的实施方式，所述系统包括水印编码器，用于将所述水印编码到所述音频流中，所述编码包括将音频添加至被确定为编码时机的至少一些所述分段，所添加的音频被添加成使得。

14、对于每一所确定的分段，所添加的音频被添加至每个所述不同频率范围或一个所述不同频率范围中的某处。 0021 进一步地，根据本发明的实施方式，所添加的音频具有等于所述信号在所述一个分段的所述基频处的所述幅度的 25% 的最大幅度。 0022 根据本发明的又一实施方式，还提供了一种方法，所述方法包括确定用于将水印编码到音频流中的多个时机，所述音频流具有多个分段，当在频域中被表示时，每个所述分段包括幅度相对于频率的信号；以及针对所述音频流的每一个所述分段：识别一个分段的基频 f，所述基频是在所述一个分段中具有所述信号的最大幅度的频率，所述基频 f 确定多个谐波频。

15、率，每个所述谐波频率位于频率 f/2n 或 2fn 处， n 为正整数；以及若所述一个分段的所述信号的幅度对于在多个不同频率范围中的一个或多个中的所有频率来说小于值 v，则将所述一个分段确定为用于编码至少部分所述水印的时机，每个所述不同频率范围以不同的一个所述谐波频率为中心。附图说明 0023 结合附图，从以下详细描述中将更充分地理解并领会本发明，在附图中： 0024 图 1 是根据本发明的实施方式构造和操作的水印系统的部分图示的部分框图示图； 0025 图 2 是示出在图 1 的系统中识别水印编码时机的示图； 0026 图 3 是示出在图 1 的系统中编码部分水印。

16、之后的分段的示图； 0027 图 4 是示出图 1 的系统中的第一编码方法的图表；以及 0028 图 5 是示出图 1 的系统中的第二编码方法的图表。具体实施方式 0029 遍及本说明书和权利要求书，术语 “编码” 以其所有的语法形式被用以指代任何类型的数据流编码，该数据流编码包括例如（但并不限制定义的范围）熟知的编码类型，诸如但不限于， MPEG-2 编码、 H.264 编码、 VC-1 编码以及诸如可缩放矢量图形（SVG）和 LASER 说明书 CN 103548079 A 5 3/8 页 6 （ISO/IEC14496-20）的合成编码等。应理解，相比未。

17、被编码的数据流，编码的数据流通常需要更多的处理并且通常需要更多的时间来读取。编码数据的任何接收器至少在不需要密码分析的情况下潜在的能够读取编码数据，而不管编码数据的接收器是否为预期的接收器。应理解可分几个步骤进行编码并可包括大量不同的处理，包括但无需限于：压缩数据；将数据转换为其他形式；以及使数据更强健（例如，复制数据或使用纠错机制）。 0030 遍及本说明书及权利要求书，术语 “压缩” 以其所有的语法形式被用以指代任何类型的数据流压缩。压缩通常是编码的一部分并且可包括图像压缩和移动补偿。通常，数据的压缩减少了包含数据的比特的数量。由于压缩是编码的子集。

18、，所以遍及本说明书和权利要求书，术语 “编码” 和 “压缩” 以它们所有的语法形式经常被交替使用。 0031 类似地，遍及本说明书和权利要求书，术语 “解码” 和 “解压” 以它们所有的语法形式被用以指代所有语法形式的 “编码” 和 “压缩” 的反面。 0032 遍及本说明书和权利要求书，术语 “加扰” 和 “加密” 以它们所有的语法形式被交替使用以指代用于加扰和 / 或加密数据流的任何合适的加扰和 / 或加密方法，和 / 或用于旨在使数据流很难理解（除了对其预期的接收器）的任何其他合适的方法。熟知的加扰或加密类型包括但不限于 DES、 3DES 以及 AES。类似地。

19、，遍及本说明书和权利要求书，术语 “解扰” 和 “解密” 以它们所有的语法形式被用以指代所有语法形式的 “加扰” 和 “加密” 的反面。 0033 依据上述定义，术语 “编码” 、“压缩” 以及术语 “加扰” 和 “加密” 用于指代不同的专有类型的处理。因而，特定的数据流可以是，例如： 0034 编码的，但既不加扰也不加密的； 0035 压缩的，但既不加扰也不加密的； 0036 加扰的或加密的，但未被编码的； 0037 加扰的或加密的，但未被压缩的； 0038 编码的和加扰的或加密的；或者 0039 压缩的和加扰的或加密的。 0040 同样地，一方面术语 “。

20、解码” 和 “解压” ，以及另一方面术语 “解扰” 和 “解密” 被用于指代不同的专有类型的处理。 0041 现参照图 1，它是根据本发明的实施方式构造和操作的水印系统 10 的部分图示的部分框图的示图。 0042 介绍一下，当一个音符以两个八度音阶同时播放时，对大多数听众来说，这两个音符听起来基本上是一样的。在下一个（较高）八度音阶中的同样的音符是当前音符的频率的两倍，在先前的（较低）八度音阶中，同样的音符是当前音符的频率的一半。在不同的八度音阶中，谐波是相同的音符。 0043 水印系统10可操作为利用不同声音之间的相似性来将水印数据14在或接近于音频流。

21、12 的不同分段的一个或多个谐波频率处编码，从而减小嵌入的音频水印对听众的听觉的干扰。 0044 具体地，水印系统 10 包括通过分析音频流 12 的各个分段的组成频率来识别用于将音频水印 14 编码在音频流 12 中的合适的编码时机。 0045 现将更详细地描述水印系统 10。 0046 水印系统 10 通常包括内容服务器 16 和多个渲染装置 18（为简便起见，只示出了说明书 CN 103548079 A 6 4/8 页 7 一个）。 0047 内容服务器 16 通常包括处理器 20 和传输设备 22。 0048 处理器20通常可操作为确定用于将水印14编码至音频流12中。

22、的多个时机。该时机标示音频流 12 的哪个分段适合于将水印 14 编码在其中。处理器 20 通常可操作为准备用于传输至渲染装置 18 的数据 24。数据 24 通常包括在频域或时域中格式化的音频流 12 以及标示所确定的时机 26 的信息。参照图 2 更详细地描述标示所确定的时机 26 的信息。 0049 传输设备22通常可操作为将数据24传输至渲染装置18。可以使用任何合适的通信方法（例如但不限于，卫星、电缆、网络协议、地面或蜂窝通信系统或其任何合适的组合）来传输数据 24。 0050 每个渲染装置 18 通常包括接收器 28 和水印编码器 30。每个渲染装置 18 也。

23、可包括其他合适的元件，例如但不限于，内容播放器和合适的驱动器。可从任何合适的渲染装置（例如但不限于，机顶盒、适当配置的计算机和移动装置）中选择渲染装置 18。 0051 接收器 28 通常可操作为从内容服务器 16 接收数据 24。 0052 每个渲染装置 18 通常与标示渲染装置 18 和 / 或渲染装置 18 的使用者 / 用户的身份标识 32 有关。身份标识 32 可部分或全部设置于安全芯片（诸如 SIM 卡或智能卡）中，该安全芯片可被设置于渲染装置 18 中或可拆卸地安插于渲染装置 18 中。水印编码器 30 通常可操作为确定水印数据 14 从而使至少部分水印数。

24、据 14 通常基于至少部分身份标识 32。作为通过水印编码器 30 形成水印数据 14 的处理的一部分，可使用任何合适密码散列（hash）打乱至少一些身份标识 32。 0053 水印编码器30通常可操作为基于接收到的标示所确定的时机的信息26将水印14 编码至音频流 12 中（框 34）。换言之，水印数据 14 只在音频流 12 的被确定为编码时机的那些分段中进行编码。 0054 图 1 示出了确定时机的处理器 20 以及将标示所确定的时机的信息 26 发送至渲染装置 18 以用于编码的传输设备 22。 0055 在内容服务器 16 中确定时机以及在渲染装置 18 中编码音频流。

25、 12 至少因以下原因是有利的。首先，渲染装置 18 可能不具有确定时机所需的处理能力。第二，由于内容服务器 16 已经知道时机的位置，所以在内容服务器 16 中标示时机可提高水印数据 14 的后续识别，即使是在噪声环境下。 0056 本领域普通技术人员将会理解，必要时，也可在渲染装置 18 中确定时机和编码水印数据 14。 0057 现参照图 2，它是示出在图 1 的系统 10 中识别水印编码时机的示图。 0058 音频流12具有多个分段38，例如但不限于，音频帧。当在频域中表示时，每个分段 38 包括幅度 42 相对于频率 44 的信号 40。在图 2 中信号。

26、 40 被示出为一系列垂直线，其为图 2 中的最粗的线。为简便起见，只标记了信号 40 的某些垂直线。每个分段 38 可具有任何合适的持续时间，例如但不限于， 30 毫秒和 100 毫秒之间。 0059 若音频流 12 在其到达处理器 20（图 1）时尚未被分成分段 38，则处理器 20 通常可操作为将音频流 12 划分成分段 38。 0060 类似地，若音频流 12 不是在频域中表示，则处理器 20（图 1）执行变换（诸如傅里叶变换）以产生音频流 12 的每个分段 38 的频域表示。说明书 CN 103548079 A 7 5/8 页 8 0061 应注意，。

27、 MPEG 编码的音频通常被编码为分段 38 的傅里叶变换，且因此针对合适的编码时机来分析 MPEG 音频帧通常需要较少的处理。 0062 处理器 20（图 1）可操作为分析分段 38 的频域表示以识别用于编码水印数据 14 （图 1）的良好候选。 0063 现更详细地描述确定编码时机。 0064 处理器 20（图 1）通常可操作为识别音频流 12 的每个分段 38 的基频 46， f。每个分段 38 的基频 46 是具有信号 40 的最大幅度的频率。每个分段 38 的基频 f 确定多个谐波频率 48。每个谐波频率 48 位于频率 f/2n 或 2fn 处， n 是正整数。谐波频。

28、率 48 通常在从 20Hz 至 20,000Hz 的频率范围内。 0065 若任一分段 38 的信号 40 的幅度对于在多个不同频率范围 50 中的一个或多个不同频率范围中的所有频率来说小于一值 v，则处理器 20 （图 1）通常可操作为将该分段 38 确定为用于编码至少部分水印 14（图 1）的时机。每个不同频率范围 50 在以该分段 38 的不同谐波频率 48 为中心的周围。因此例如，一个频率范围 50 可在以 f/2 为中心的周围，并且另一个频率范围 50 可在以 2f 为中心的周围。 0066 仅举例来说，可以依据由内容供应商或广播公司所选的编码标准将水印数据 1。

29、4 （图 1）编码在一个频率范围 50 中或多个频率范围 50 中。因此，处理器 20（图 1）将依据编码标准检查一个频率范围 50 或多个频率范围 50 来看信号 40 是否小于值 v。举例来说，处理器 20 可寻找其中信号 40 在以频率 f/2 为中心的周围的频率范围 50 中总是低于值 v 的分段 38。可替代地，处理器 20 可寻找其中信号 40 在以频率 f/2 为中心的周围的频率范围 50 和以频率 2f 为中心的周围的频率范围这两者中总是低于值 v 的分段 38，且因此，只有其中信号 40 在以频率 f/2 和 2f 两者为中心的周围的频率范围 50 中总。

30、是低于值 v 的那些分段 38 将会被选择为时机。 0067 现在进行关于值 v 的选择的讨论。 0068 为了将水印数据 14 从音频流 12 中去除，渲染装置 18（图 1）的用户可决定记录音频流 12 并随后回放具有编码在其中的水印数据 14（图 1）的音频流 12 以用于输出至另一装置。另一装置可随后对所接收到的音频流 12 再编码。若水印数据 14 的编码不是用足够大的幅度来编码的，则通过另一装置对音频流 12 的再编码可以掩盖该编码。因此，通过水印编码器 30（图 1）的水印编码需要足够大以防止被掩盖，但还要足够小以便不干扰听众。发明人提出通过添加幅度近似。

31、等于基频 46 幅度的四分之一的音频来对所选择的时机进行编码。然而，所添加的音频的精确幅度可以依据你不想干扰的听众的类型和你想保护以对抗的再编码算法以及其他可能的因素。 0069 要考虑的另一个因素是在编码水印数据 14 （图 1）后的分段 38 的相关频率范围 50 中的信号 40 的幅度需要足够小以使该分段的基频 46 不会被淹没（这可能严重改变声音）。 0070 因此，考虑到上述要求，为了决定是否在特定分段 38（即，该分段 38 为时机）中编码部分水印数据 14，可能用于在其中编码部分水印数据 14 的可用频率范围 50 需要具有足够富余的幅度，使得可添加更。

32、多的用于编码的音频。发明人提出值 v 通常等于 b/4，其中， b 是该分段 38 的基频 46 的幅度。 0071 每个不同的频率范围50的大小通常分别等于在每个不同频率范围50的中心处的频率 48 的 6%。因此例如，若在频率范围 50 中心处的谐波频率 48 具有 500Hz 的频率，则频说明书 CN 103548079 A 8 6/8 页 9 率范围 50 是 500Hz 的 6% （其等于 30Hz）。因此，频率范围 50 从 470Hz 延伸至 530Hz。发明人提出值 6% 是因为它通常是两个相邻音符之间的步幅。 0072 图 2 示出针对音频流 12 的两个。

33、分段 38（即，分段 52 和分段 54）的信号 40。 0073 将首先假定编码标准要求水印编码发生在谐波频率 48， f/2 和 2f 两者周围并且 v 等于 b/4 来分析分段 52、 54。 0074 分段 52 表示在以频率 f/2 为中心的周围的频率范围 50 中信号 40 的幅度为 0 并且在以频率 2f 为中心的周围的频率范围 50 中的信号 40 包括信号 40 的两个部分（部分 56 和部分 58）。两个部分 56、 58 都低于 b/4。因此，分段 52 将被选择为编码时机。 0075 关于分段 54，在以频率 f/2 为中心的周围的频率范围 50 中，信。

34、号 40 的幅度为 0，并且在以频率2f为中心的周围的频率范围50中，信号40包括信号40的两个部分（部分60 和部分 62）。部分 60 具有小于 b/4 的幅度，但部分 62 具有大于 b/4 的幅度。因此，分段 52 将不会被选择为编码时机。 0076 若假定编码标准要求水印编码只出现在谐波频率 f/2 处或其附近并且 v 等于 b/4 来分析分段 52、 54，则分段 52、 54 都将被选为编码时机。 0077 对于由处理器 20（图 1）确定为编码时机的每个分段 38，处理器 20 通常可操作为准备标示所确定的时机的信息 26 （图 1），该信息 26 包括。

35、：相关分段 38 的定时信息；在相关分段 38 的基频 46 处的信号 40 的幅度（因为为了编码部分水印数据 14（图 1）而被添加至信号 40 的音频的幅度可被确定为基频 46 的一部分）；以及编码将发生在相关分段 38 中的一个或多个谐波频率 48 或者将能够计算谐波频率 48 的基频 46 的频率。 0078 根据本发明的实施方式，对水印数据 14（图 1）的一个比特的编码基于其中编码时机是成对的两个编码时机。参照图 5 更详细地描述该编码方法。因此，根据该实施方式，处理器 20（图 1）可操作为准备标示所确定的时机的信息 26（图 1）以包括确定。

36、被确定为编码水印 14 的时机的多对分段 38 的数据。 0079 现参照图 3，它是示出在图 1 的系统 10 中编码部分水印数据 14（图 1）之后的图 2 的分段 52 的示图。 0080 水印编码器 30 （图 1）通常可操作为基于接收到的标示所确定的时机的信息 26 （图 1）将水印 14 编码至音频流 12（图 2）中。编码通常包括将音频 64 添加至被确定为编码时机的至少一些分段38。根据编码标准，所添加的音频64通常被添加成使得对于每个分段38 （确定为时机），所添加的音频 64 被添加至每个不同频率范围 50 或一个频率范围 50 中的某处。尽管所添加。

37、的音频 64 可被添加至所选择的频率范围中的任意位置，但为了最小化对听众的干扰，音频 64 通常被添加至尽可能地接近谐波频率 48。 0081 对于每个被编码的分段38，所添加的音频64通常具有等于该分段38的基频46处的信号 40 的幅度的 25% 的最大幅度。 0082 通常通过修改每个相关分段 38 的信号 40 来添加音频 64。换言之，音频 64 被添加在频域中，例如，通过为每个音频帧修改 MPEG 编码的音频数据来添加。 0083 若渲染装置 18（图 1）没有权限访问频域中的音频流 12（图 2）的数据，则渲染装置 18 可基于标示被确定的时机的信息 2。

38、6（图 1）在特定频率特定时间处生成声音。 0084 现参照图 4，它是示出图 1 的系统 10 中的第一编码方法的图表。同样也参照图 3。 0085 水印数据 14 可表示为比特流，一系列 “0” 和 “1” 。比特流中的每个比特通常被编说明书 CN 103548079 A 9 7/8 页 10 码在被选为编码时机的不同的分段 38 中。 0086 图 4 示出了十二个分段 38。在这十二个分段中，分段 1、 4-6、 10 和 12 被确定为编码时机。 0087 通过在谐波频率或频率 48（根据编码标准，例如在频率 f/2 和 / 或 2f）处添加音频 64 来将 “。

39、1” 编码在一个分段 38 中。通过不添加音频 64 来将 “0” 编码在一个分段 38 中。如此，各个 “1” 和 “0” 可被编码在编码时机中。 0088 因此对于分段 1、 5、 6 和 12，通过添加音频 64（图 3）来编码 “1” 。对于分段 4 和 10，通过不添加音频来编码 “0” 。 0089 该编码法可能会导致错误，由此出现 “0” 事实上是编码错误，诸如 “1” 被错误地编码或跳过。 0090 此外，由于不可能或很难知道它是否是容易跳过的时机或者它是否是 0，通常不可能随机跳过时机，除非跳过时机是编码方法的一部分。 0091 现参照图 5，它是示。

40、出图 1 的系统 10 中第二编码方法的图表。同样也参照图 3。 0092 图 5 示出了十二个分段 38。在这十二个分段 38 中，分段 1、 4-6、 8-10 和 12 被确定为编码时机。 0093 此外，为了编码的目的而将时机配对。 0094 图 5 示出了形成一对的分段 1 和分段 4、形成一对的分段 5 和分段 6、形成一对的分段 8 和分段 9 以及形成一对的分段 10 和分段 12。 0095 通过在谐波频率或频率 48（根据编码标准，例如在频率 f/2 和 / 或 2f）处添加音频 64 来将 “1” 编码在一对分段 38 中的第一分段 38 内。 0096。

41、通过在谐波频率或频率 48（根据编码标准，例如在频率 f/2 和 / 或 2f）处添加音频 64 来将 “0” 编码在一对分段 38 中的第二分段 38 内。 0097 因此为了编码 “1” 而将音频 64 添加至分段 1 而不是分段 4 中。为了编码 “0” 而将音频 64 添加至分段 9 而不是分段 8 中。 0098 音频 64 已被添加至分段 5 和分段 6 两者中。因此，包括分段 5 和 6 的一对的编码是无效的。音频 64 未被添加至分段 10 或分段 12 中。因此，包括分段 10 和 12 的一对的编码被跳过。 0099 为防止对嵌入在音频流 12 中的水印数。

42、据 14 的检测，老道的黑客可以决定通过一个或更多的八度音阶来增加或减少音频频率。使用对数仍可检测出这一变化。若初始频率是 F 且篡改频率是 mF（m 取决于音频被偏移了多少个八度音阶），则 log（mF）在算数上等于 log m 加上 log F。初始信号被偏移了确定的数量，且因此可检测出篡改。 0100 实际上，某些或全部的这些功能可被结合在单个物理部件中，或者可替代地，使用多个物理部件来实施。这些物理部件可包括硬连线或可编程装置或这两者的结合。在某些实施方式中，至少某些处理电路的功能可以在合适的软件控制下通过可编程处理器来执行。例如，该软件可以电子形式通。

43、过网络下载至装置26。可替代地或额外地，软件可以存储在有形的、非暂时性的计算机可读存储介质中，诸如光存储器、磁存储器或电子存储器。 0101 应当理解，如果需要的话，本发明的软件部件可以 ROM（只读存储器）形式来实施。如果需要的话，软件部件可通常使用常规技术在硬件中实施。应进一步理解，软件部件例如可示例为计算机程序产品；在有形的介质上；或可由合适的计算机解译的信号。说明书 CN 103548079 A 10 8/8 页 11 0102 将理解，为清晰起见，在单独的实施方式的上下文中描述的本发明的各个特征也可在单个实施方式中以组合的形式来提供。相反，为简便起见，在单个实施方式的上下文中描述的本发明的各个特征也可单独地或者以任何适合的子组合来提供。 0103 本领域技术人员将理解，本发明不由上文具体示出和描述的内容来限制。而是由所附权利要求及其等价物来限定本发明的范围。说明书 CN 103548079 A 11 1/3 页 12 图 1 说明书附图 CN 103548079 A 12 2/3 页 13 图 2 说明书附图 CN 103548079 A 13 3/3 页 14 图 3 图 4 图 5 说明书附图 CN 103548079 A 14 。

展开阅读全文