《用于执行音频水印解码的方法、装置以及制造品.pdf》由会员分享,可在线阅读,更多相关《用于执行音频水印解码的方法、装置以及制造品.pdf(19页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102237092 A (43)申请公布日 2011.11.09 CN 102237092 A *CN102237092A* (21)申请号 201110105251.2 (22)申请日 2011.04.26 12/767,422 2010.04.26 US G10L 19/00(2006.01) (71)申请人 尼尔森 ( 美国 ) 有限公司 地址 美国伊利诺伊州 (72)发明人 DJ尼森 韦努戈帕尔斯里尼瓦桑 约翰C派弗 (74)专利代理机构 北京三友知识产权代理有限 公司 11127 代理人 张旭东 宋教花 (54) 发明名称 用于执行音频水印解码的方法、 装置。
2、以及制 造品 (57) 摘要 本发明涉及用于执行音频水印解码的方法、 装置以及制造品。公开了用于执行音频水印解码 的示例性方法、 装置以及制造品。 一种公开的示例 性方法包括以下步骤 : 接收音频信号, 该音频信 号包括利用第一多个频率分量嵌入的听者测量代 码 ; 对所述音频信号进行采样 ; 将所采样音频信 号变换成第一频域表示 ; 确定是否能够在所述第 一频域表示的所述第一多个频率分量中检测到所 述代码 ; 以及当在所述第一多个频率分量中未检 测到所述代码时, 检查第二频域表示的第二多个 频率分量, 以确定是否检测到所述代码, 所述第二 多个频率分量相对于所述第一多个频率分量偏移 了第一偏移。
3、, 所述第一偏移对应于采样频率失配。 (30)优先权数据 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 10 页 附图 6 页 CN 102237097 A1/2 页 2 1. 一种方法, 该方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及 当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多个频 率分量, 以确定是。
4、否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分 量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 2. 根据权利要求 1 所述的方法, 其中, 所述第二频域表示包括所述第一频域表示。 3. 根据权利要求 1 所述的方法, 其中, 所述方法还包括 : 将所采样的音频信号变换成所 述第二频域表示。 4. 根据权利要求 1 所述的方法, 所述方法还包括 : 选择所述第二多个频率分量中的、 要 与所述第一多个频率分量中的对应频率分量相邻的各频率分量。 5. 根据权利要求 1 所述的方法, 所述方法还包括 : 选择所述第二多个频率分量中的第 一频率分量, 以具有比所述第一多个频率分。
5、量中的第一频率分量更窄的带宽。 6. 根据权利要求 1 所述的方法, 所述方法还包括 : 调节与所述音频信号的采样相关联 的频率, 以选择所述第二多个频率分量。 7. 根据权利要求 1 所述的方法, 所述方法还包括以下步骤 : 当在所述第二多个频率分 量中未检测到所述代码时, 检查第三频域表示的第三多个频率分量, 以确定是否检测到所 述代码, 所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移 的第二偏移, 所述第二偏移对应于第二采样频率失配。 8. 根据权利要求 1 所述的方法, 所述方法还包括 : 基于所述第一偏移来选择将采样音 频信号变换成所述第二频域表示所使用的参数。
6、。 9. 根据权利要求 1 所述的方法, 所述方法还包括 : 从偏移列表中选择所述第一偏移。 10. 根据权利要求 1 所述的方法, 所述方法还包括 : 当在所述第二多个频率分量中检测 到所述代码时, 将所述第一偏移添加至偏移列表。 11. 一种装置, 该装置包括 : 音频信号的音频输入接口, 该音频信号包括使用第一多个频率分量嵌入的听者测量代 码 ; 采样器, 该采样器用于对所述音频信号进行采样 ; 时域频域转换器, 该时域频域转换器用于将所采样的音频信号变换成第一频域表示 ; 以及 频域解码器, 该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频 率分量中检测到所述代码, 并且。
7、当在所述第一多个频率分量中未检测到所述代码时, 检查 第二频域表示的第二多个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量 相对于所述第一多个频率分量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 12. 根据权利要求 11 所述的装置, 其中, 当在所述第二多个频率分量中未检测到所述 代码时, 所述频域解码器检查第三频域表示的第三多个频率分量, 以确定是否检测到所述 代码, 所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移的 权 利 要 求 书 CN 102237092 A CN 102237097 A2/2 页 3 第二偏移, 所述第二偏移对应于第二。
8、采样频率失配。 13. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于从 偏移列表中选择所述第一偏移。 14. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于当 在所述第二多个频率分量中检测到所述代码时, 将所述第一偏移添加至偏移列表。 15. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于基 于所述第一偏移来选择将采样音频信号变换成所述第二频率表示所使用的参数。 16. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于选 择要与所述第一多个频率分量中的对应频率分量相邻。
9、的所述第二多个频率分量。 17. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于配 置所述第二多个频率分量中的第一频率分量, 以具有比所述第一多个频率分量中的第一频 率分量更窄的带宽。 18. 一种存储机器可读指令的有形制造品, 该机器可读指令在被执行时, 使得机器 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及 当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多。
10、个频 率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分 量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 19. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器将所采样的音频信号变换成所述第二偏移表示。 20. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器选择所述第二多个频率分量中的、 要与所述第一多个频率分量中的对应频率分量相邻 的各频率分量。 21. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器选择所述第二多个频率分量。
11、中的第一频率分量, 以具有比所述第一多个频率分量中的 第一频率分量更窄的带宽。 22. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器调节与所述音频信号的采样相关联的频率, 以选择所述第二多个频率分量。 23. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器基于所述第一偏移来选择将采样音频信号变换成所述第二频域表示所使用的参数。 24. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器从偏移列表中选择所述第一偏移。 25. 根据权利要求 18 所述的有形制造品, 其。
12、中, 所述机器可读指令在被执行时, 使所述 机器当在所述第二多个频率分量中检测到所述代码时将所述第一偏移添加至偏移列表。 权 利 要 求 书 CN 102237092 A CN 102237097 A1/10 页 4 用于执行音频水印解码的方法、 装置以及制造品 技术领域 0001 本公开总体上涉及媒体监测, 并且更具体地说, 涉及用于执行音频水印解码的方 法、 装置以及制造品。 背景技术 0002 标识媒体内容 ( 例如, 电视 (TV) 节目、 无线电节目、 广告、 评论、 音频 / 视频内容、 电影、 商业广告节目、 广告等 ) 有用于评价对这种内容的视听者接触率 (exposure)。。
13、例如, 在视听者计量应用中, 可以将代码或水印插入或嵌入媒体内容的音频或视频 ( 例如, 节目 或广告 ) 中, 其中, 随后在呈现 ( 例如, 在受监测家庭播放 ) 该媒体内容时在一个或更多个 监测点处检测代码 / 水印。嵌入到原始信号中的代码 / 水印的信息净荷可以包括独特节目 标识、 源标识、 广播方信息, 以及 / 或广播时间。监测点可以包括诸如家庭、 商店、 营业地点 以及 / 或任何其它公共和 / 或私人机构的场所, 其中, 监测媒体内容接触率和 / 或媒体内容 消费量。例如, 在监测点, 捕获来自音频和 / 或视频的代码 / 水印。可以将所收集的代码 / 水印发送给中心数据收集机。
14、构, 以对诸如内容消费统计的计算进行分析。 发明内容 0003 本发明提供一种用于执行音频水印解码的方法、 装置以及制造品。 0004 本发明提供的方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个 频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第 一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代 码 ; 以及当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多 个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频 率分量偏移了第一偏移, 所述第一偏移对应于采。
15、样频率失配。 0005 本发明提供的装置包括 : 音频信号的音频输入接口, 该音频信号包括使用第一多 个频率分量嵌入的听者测量代码 ; 采样器, 该采样器用于对所述音频信号进行采样 ; 时域 频域转换器, 该时域频域转换器用于将所采样的音频信号变换成第一频域表示 ; 以及频域 解码器, 该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频率分量中 检测到所述代码, 并且当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域 表示的第二多个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所 述第一多个频率分量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 0。
16、006 本发明提供了一种存储机器可读指令的有形制造品, 该机器可读指令在被执行 时, 使得机器 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代 码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够 在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及当在所述第一多个 频率分量中未检测到所述代码时, 检查第二频域表示的第二多个频率分量, 以确定是否检 测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移, 所 说 明 书 CN 102237092 A CN 102237097 A2/10 页 5 。
17、述第一偏移对应于采样频率失配。 附图说明 0007 图 1 是采用嵌入到复合电视信号的音频部分中的识别码的示例性广播视听者测 量系统的示意图。 0008 图 2 例示了实现图 1 的示例性编码器的示例性方式。 0009 图 3 例示了实现图 1 的示例性解码器的示例性方式。 0010 图 4 和 5 例示了可以例如通过处理器来执行的、 用于实现图 1 和图 3 的示例性解 码器的示例性处理。 0011 图 6A 和 6B 例示了可以通过图 3 的示例性解码器进行补偿的示例性频率偏移。 0012 图 7 是可以用于和 / 或编程为实现图 4 和图 5 的、 用于实现对图 1 和图 3 的示例 性。
18、解码器和 / 或示例性偏移补偿器的示例性处理的示例性处理器平台的示意图。 具体实施方式 0013 公开了用于执行音频水印解码的示例性方法、 装置以及制造品。所公开的示例性 方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入其中的听 者测量代码 ; 对该音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是 否能够在该第一频域表示的第一多个频率分量中检测到该代码 ; 以及当在第一多个频率分 量中未检测到该代码时, 检查第二频域表示的第二多个频率分量, 以确定是否检测到该代 码, 该第二多个频率分量相对于第一多个频率分量偏移了第一偏移, 该第一偏移对应于采。
19、 样频率失配。 0014 所公开的示例性装置包括 : 对音频信号的音频输入接口, 该音频信号包括使用第 一多个频率分量嵌入其中的听者测量代码 ; 采样器, 该采样器用于对音频信号进行采样 ; 时域频域转换器, 该时域频域转换器用于将所采样的音频信变换成第一频域表示 ; 以及频 域解码器。 该频域解码器用于确定是否能够在该第一频域表示的第一多个频率分量中检测 到该代码 ; 并且当在第一多个频率分量中未检测到该代码时, 检查第二频域表示的第二多 个频率分量, 以确定是否检测到该代码, 该第二多个频率分量相对于第一多个频率分量偏 移了第一偏移, 该第一偏移对应于采样频率失配。 0015 下列描述分别。
20、提及音频编码和解码, 该音频编码和解码还被称为音频水印印制和 水印检测。 应注意到, 关于这点, 音频是具有落入正常人类声频谱内的频率的任何类型的信 号。例如, 音频可以是语音、 音乐、 音频和 / 或视频节目 ( 例如, 电视 (TV) 节目、 电影、 因特 网视频、 无线电节目、 插播商业广告等 ) 的音频部分、 噪音, 或任何其它声音。 0016 一般来说, 对音频进行编码指将一个或更多个代码插入该音频中。 在一些示例中, 该代码被心理声学地掩盖, 以使得该代码对于音频的人类听者来说是听不见的。 然而, 可能 存在该代码对于某些人类收听者来说听得见的某些情况。这些代码还可以被称为水印。嵌。
21、 入到音频中的这些代码可以具有任何适当的长度, 并且可以利用用于将信息 ( 例如, 信道 标识符、 站标识符、 广播方标识符、 内容创建者标识符、 内容拥有者标识符、 节目标识符、 时 间戳、 广播标识符等 ) 映射至这些代码的任何适当的技术。而且, 可以将这些代码转换成由 嵌入到音频中的、 具有选定频率的信号所表示的符号。任何适当的进行编码和 / 或纠错的 说 明 书 CN 102237092 A CN 102237097 A3/10 页 6 技术都可以用于将代码转换成符号。这种听者测量代码的一些示例包括 Nielsen 公司 ( 美 国 )、 LLC、 本专利的受让人所有的 Nielsen。
22、 码。Nielsen 码是由 Nielsen 公司 ( 美国 )、 LLC、 Nielsen 公司 ( 美国 ) 的任何分支机构或 LLC 的任何分支机构嵌入到任何媒体内容中的任 何代码, 和 / 或与 Nielsen 公司 ( 美国 )、 LLC 或与 Nielsen 公司 ( 美国 ) 的任何分支机构、 LLC 的任何分支机构相关联地嵌入到任何媒体内容中的任何代码。在于此描述的示例中, 在发送和 / 或广播之前, 和 / 或发送和 / 或广播期间, 将媒体内容编码成包括一个或更多个 这种代码。当在内容呈现设备上呈现 ( 例如, 通过 TV、 无线电、 计算设备、 蜂窝电话、 手持设 备, 。
23、以及/或任何其它适当设备播放)媒体内容时, 处于呈现区域中的人不仅接触该媒体内 容, 而且不为他们所知的是, 还接触了嵌入到该媒体内容中的代码。 0017 虽然参照包括嵌入了和/或编码到其音频部分中的代码的广播音频/视频媒体内 容 ( 例如, TV 节目、 商业广告节目、 电影等 ) 对以下示例进行描述, 但这种示例仅是例示性 的。例如, 代码可以附加地或另选地嵌入和 / 或编码到其它类型的媒体内容, 诸如但不限于 音频内容、 视频内容、 图形内容、 图像、 游戏、 调查 (survey), 以及 / 或网页。而且, 在此描述 的方法和装置可以用于检测嵌入到任何数量和 / 或类型的附加地和 /。
24、 或另选的媒体内容 ( 例如, 无线电广播、 音频通知等 ) 中的代码。而且, 媒体内容不需要广播。例如, 媒体内容 可以经由任何数量和 / 或类型的有形介质 ( 如包括嵌入代码的数字万用盘 (DVD) 和 / 或光 盘 (CD) 来散布。 0018 图 1 示出了示例性编码与解码系统 100。图 1 的示例性系统 100 描绘了示例性电 视观众测量系统, 其将用作进一步描述在此公开的示例性解码处理的情境。图 1 的示例性 系统100包括编码器102, 该编码器102将代码103添加至音频信号104, 来生成编码音频信 号 105。代码 103 可以表示任何期望的或选定的信息。例如, 在媒体监。
25、测背景下, 代码 103 可以表示诸如电视广播、 无线电广播等的广播媒体内容的标识。另外, 代码 103 可以包括指 示将该代码 103 插入到音频中的时间或媒体广播时间的定时信息。 0019 音频信号 104 可以是任何形式的音频, 例如包括话音、 音乐、 噪音、 商业广告音频、 与电视节目、 现场演奏等相关联的音频。在图 1 的示例中, 编码器 102 将编码音频信号 105 传递至发送器 106。该发送器 106 将编码音频信号 105 连同与该编码音频信号 105 相关联 的任何视频信号 108 一起发送。在一些情况下, 虽然编码音频信号 105 可能具有关联的视 频信号 108, 但。
26、编码音频信号 105 不需要具有任何关联的视频。 0020 尽管图 1 所示示例性系统 100 的发送侧示出了单个发送器 106, 但该发送侧可以 更加复杂, 并且可以包括在可以传递音频信号 104 的散布链中的多个级。例如, 该音频信号 104 可以在全国网络级生成并且向局部网络级传递以进行局部散布。因此, 尽管在发送器 106之前的发送队列中示出了编码器102, 但可以在音频信号104的整个散布链放置一个或 更多个编码器。因此, 音频信号 104 可以按多个级来编码并且可以包括与那些多个级相关 联的多个嵌入代码。下面, 结合图 2, 对实现示例性编码器 102 的示例性方式进行描述。 00。
27、21 图1的示例性发送器106可以包括 : 可以通过自由空间传播(例如, 经由陆地或卫 星通信链路 ) 散布编码音频信号的一个或更多个射频 (RF) 发送器, 或者用于通过电缆、 光 纤等散布编码音频信号的发送器。在一些示例中, 发送器 106 用于遍及广的地理区域广播 编码音频信号105。 在其它情况下, 发送器106可以通过有限的地理区域散布编码音频信号 105。 这种发送可以包括将编码音频信号105上变频至射频, 以能够传播编码音频信号105。 说 明 书 CN 102237092 A CN 102237097 A4/10 页 7 另选的是, 该发送可以包括散布采用数字值或数字值包形式的。
28、编码音频信号 105, 该数字值 或数字值包可以通过一个或更多个网络 ( 如因特网、 广域网、 和 / 或局域网 ) 进行发送。因 而, 编码音频信号 105 可以通过载波信号、 通过信息包和 / 或通过任何适当的技术来传送, 以散布音频和 / 或视频信号。 0022 当通过接收器 110( 在媒体监测的情境下, 该接收器 110 可位于统计上选定的计 量点 112 处 ) 接收示例性的编码音频信号 105 时, 对该音频信号 105 进行处理以恢复代码 103, 即使在通过接收器 110 的扬声器 114 呈现编码音频信号 105 时, 收听者觉察不到 ( 或 大致觉察不到 ) 代码 103。
29、 的存在。为此, 解码器 116 直接连接至接收器 110 处可用的音频 输出部 118, 或者连接至放置在再现音频 105 的扬声器 114 附近的麦克风 120。所接收音频 信号 105 可以是单声道格式或者立体声格式。下面, 结合图 3, 对实现图 1 的示例性解码器 116 的示例性方式进行描述。 0023 图 2 例示了实现图 1 的示例性编码器 102 的示例性方式。如上所述, 图 2 的示例 性编码器 102 将一个或更多个听不见 ( 或大致听不见 ) 的代码 103 插入到音频 104 中, 以 创建编码音频 105。在图 2 所示的示例中, 编码器 102 包括采样器 201。
30、, 该采样器 201 用于 按采样频率 202 对音频 104 进行采样, 以形成采样的音频信号 203。将示例性采样器 201 耦 接至掩蔽估算器(masking evaluator)204, 其估算音频104将代码103隐藏在其中的能力。 代码103被提供给代码频率选择器206, 代码频率选择器206确定或选择将代码103插入或 嵌入到采样的音频 203 中所使用的频率。代码频率选择器 206 可以利用任何适当的检测或 校正编码将代码 103 转换成符号。将对指定或选定的代码频率 ( 该代码频率用于呈现代码 103) 的指示 207 传递至掩蔽估算器 204, 以使该掩蔽估算器 204 获。
31、知该频率, 针对该频率应 当确定通过音频 104 对代码 103 的掩蔽。另外, 将对代码频率的指示 207 提供给代码合成 器 208, 该代码合成器 208 生成具有代码频率选择器 206 所指定的频率的正弦波信号 209。 组合器210接收来自代码合成器208的合成的代码频率209和向采样器提供的音频104, 并 将这两者进行组合以生成编码音频 105。 0024 在以模拟形式将音频 104 提供给编码器 102 的一些示例中, 示例性采样器 201 利 用模拟数字转换器或任何其它适当的数字转换器来实现。采样器 201 可以以例如 48000 赫 兹 (Hz) 或适于满足 Nyquist。
32、 标准的任何其它采样率对音频 104 进行采样。例如, 如果将音 频 104 频率上限制在 15000Hz, 则采样器 201 可以以 30000Hz 的采样频率 202 来操作。来自 采样器 201 的各样本 203 可以通过数字比特串来表示, 其中, 比特数表示音频 104 被采样的 精度。例如, 采样器 201 可以生成 8 比特、 16 比特、 24 比特, 或 32 比特值 302。 0025 除了对音频 104 进行采样以外, 图 2 的示例性采样器 201 将要一起处理的许多样 本 ( 即, 音频块 ) 进行累积。例如, 示例性采样器 201 一次可以累积向掩蔽估算器 204 传。
33、递 的 512 个样本音频块。另选的是, 掩蔽估算器 204 可以包括累加器, 在该累加器中, 在音频 块被处理之前将它们累积在缓冲区中。 0026 图2的示例性掩蔽估算器204接收或累积这些样本(即, 512个样本), 并确定所累 积的样本的向人类听力大致隐藏代码频率的能力。即, 掩蔽估算器 204 例如通过整体估算 音频 104 的各临界频带以确定其能量, 并确定各临界频带的类似噪声或类似音调的属性以 及确定这些临界频带掩蔽代码频率的总体能力, 来确定这些代码频率是否可以隐藏在由所 累积的样本表示的音频 104 内。临界频带 ( 其可以通过对人类听知觉执行的实验研究来确 说 明 书 CN 。
34、102237092 A CN 102237097 A5/10 页 8 定 ) 在宽度上可以从频谱低端处的窄频带至声频谱高端处更宽频带进行改变。如果掩蔽估 算器 204 确定可以将代码频率隐藏在音频 104 中, 则掩蔽估算器 204 指示可以将代码频率 插入到音频 104 内的振幅等级, 同时仍保持大致隐藏, 并向代码合成器 208 提供振幅信息。 0027 在一些示例中, 代码频率选择器 206 利用将输入代码 103 与状态相联系的查寻表 来实现, 在该查寻表中, 各状态表示要在编码音频信号 105 中强调的许多代码频率。换句话 说, 可以根据代码频率映射表将输入代码 103 映射至代码频。
35、率。代码频率选择器 206 可以 包括将符号或数据状态与冗余地表示数据状态的代码频率集相联系的信息。 选定的供使用 的状态的数目可以基于输入代码 103 的类型。例如, 可以将包含两个比特的输入代码 103 转换成表示四个符号或状态 ( 例如, 22) 中的一个的代码频率。在其它示例中, 包含四比特 信息的输入代码 103 由 16 个符号或状态 ( 例如, 24) 中的一个表示。在将代码 103 转换成 一个或更多个符号或状态时, 可以附加地或另选地使用一些其它编码来加入纠错。 另外, 在 一些示例中, 可以将一个以上代码 103 嵌入到音频 104 中。 0028 当经由采样块的傅里叶变换。
36、而在频域中表示音频信号 104 时, 利用代码频率映射 表选定的频率指数对应于要嵌入到音频信号 104 中的正弦波频率。参考频率指数而不是实 际频率, 这是因为这些指数所对应的频率基于编码器 102 内使用的采样率 202 和由解码器 116 处理的采样数而变。与相邻指数对应的相邻频率之间的间隔与采样频率 202 和音频块 尺寸的比率成比例。例如, 以 48000Hz 的采样率和 18432 个样本的音频块尺寸, 相邻指数之 间的间距约为 2.6Hz。因而, 频率指数 360 对应于 936Hz(2.6Hz360)。当然, 可以选择其 它采样率和块尺寸, 由此可以选择其它频率间隔。 而且, 不。
37、是所有频率指数都需要用于例如 避免与用于传送其它代码和 / 或水印的频率的干扰。而且, 所选定和 / 或使用的频率范围 不需要连续。在一些示例中, 使用 0.8kHz 至 1.03kHz 与 2.9kHz 至 4.6kHz 范围内的频率。 在其它示例中, 使用 0.75kHz 至 1.03kHz 与 2.9kHz 至 4.4kHz 范围内的频率。 0029 图 2 的示例性代码合成器 208 从代码频率选择器 206 接收对要包括频率指数的指 示 207, 以创建包括对输入代码 103 的表示的编码音频信号 105。响应于对频率指数的指示 207, 代码合成器208生成具有所识别的频率的许多正。
38、弦波(或包括多个正弦波的一个复合 信号 )。这种合成可以导致正弦波信号或者导致表示正弦波信号的数字数据。在一些示例 中, 代码合成器 208 生成具有由掩蔽估算器 204 所指示的振幅的代码频率。在其它示例中, 代码合成器 208 生成具有固定振幅的代码频率, 并且那些振幅可以通过在代码合成器 208 内实现的或者设置在代码合成器 208 与组合器 210 之间的一个或更多个增益块 ( 未示出 ) 来调节。 0030 虽然前面描述了生成正弦波或表示正弦波的数据的示例性代码合成器 208, 但代 码合成器的其它示例性实现也是可以的。例如, 另一示例性代码合成器 208 不是生成正弦 波, 而是可。
39、以输出频域系数, 该频域系数用于调节提供给组合器 210 的特定音频频率的振 幅。以这种方式, 可以将音频 104 的频谱调节成包括必要的正弦波。 0031 图 2 的示例性组合器 210 接收代码合成器 208 的输出 209 和音频 104 两者, 并将 它们进行组合以形成编码音频 105。组合器 210 可以以模拟或数字形式来组合代码合成器 208 的输出 209 和音频 104。如果组合器 210 执行数字组合, 则代码合成器 208 的输出 209 可以与采样器 201 的输出相组合, 而不是与输入至采样器 201 的模拟音频 104 相组合。例 如, 数字形式的音频块可以与数字形式。
40、的正弦波相组合。另选的是, 该组合可以在频域执 说 明 书 CN 102237092 A CN 102237097 A6/10 页 9 行, 其中, 音频 104 的频率系数根据表示正弦波的频率系数来调节。作为另一另选例, 可以 以模拟形式组合正弦波和音频 104。编码音频 105 可以以模拟或数字形式从组合器 210 输 出。如果组合器 210 的输出 105 是数字的, 则可以在将其耦接至发送器 106 之前随后将其 转换成模拟形式。 0032 在 2008 年 10 月 10 日提交的美国专利申请 No.12/249619、 2009 年 8 月 31 日提交 的美国专利申请 No.12。
41、/551220, 以及 2009 年 5 月 12 日提交的美国专利申请 No.12/464811 中描述了可以用于选择代码频率、 通过音频104分析对嵌入代码的掩蔽, 以及/或实现代码 频率映射表的示例性方法、 装置以及制造品、 示例性采样器 201、 示例性掩蔽估算器 204、 示 例性代码频率选择器 206、 示例性代码合成器 208、 示例性组合器 210 和 / 或示例性编码器 102, 通过引用将各专利申请的全部内容合并入于此。 0033 图 3 例示了实现图 1 的实例解码器 116 的示例性方式。图 3 的实例解码器 116 对 插入到音频 104 中的代码 103 进行检测、。
42、 解码以及 / 或提取, 以在编码器 102 处形成编码音 频 105。如图 1 所示, 编码音频 105 可以经由有线和 / 或无线连接提供至接收器 110。而在 下列描述中, 为了容易理解而假定解码器 116 基本上处理由编码器 102 形成的同一编码音 频 105, 一般来说, 由解码器 116 处理的音频例如由于发送器 106、 接收器 110 以及 / 或任何 介入的传输媒体所引入的失真、 噪声等而不同。因此, 实际上, 这种影响通过执行任何数量 和 / 或类型的适当的噪声缩减、 失真减轻以及 / 或纠错技术来进行控制。 0034 图3的示例性解码器116包括采样器302, 以模拟形。
43、式向该采样器302提供编码音 频 105, 该采样器 302 可以利用模拟数字转换器或任何其它适当的技术来实现。图 3 的示 例性采样器 302 例如以 48000Hz 的标称采样频率 303 对编码音频 105 进行采样。当然, 可 以有利地选择更低的采样频率, 以便在解码时降低计算负荷。然而应当将采样频率 303 选 择成满足 Nyqusit 标准。而且, 如下所述, 可以将采样频率 303 调节和 / 或选择成对采样频 率 202( 图 2)、 接收器 110 中采用的用于经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进。
44、行补偿。这种采样频率失配和 / 或 差异可以导致嵌入的代码 103 在解码器 116 中以错误的代码频率出现, 并由此可以削弱解 码器 116 正确地解码、 检测以及 / 或提取代码 103 的能力。采样频率失配可能例如因在接 收器 114 和 / 或解码器 116 中使用低成本晶体和 / 或因导致谐振频率漂移的晶体老化而造 成。低成本晶体通常在消费级装置 ( 如个人计算机 (PC) 或机顶盒中发现, 其中, 从理想中 心频率的轻微漂移对人耳不易察觉, 但可能影响对嵌入的代码的检测、 解码和 /或提取。通 常, 编码器 102 利用准确的时基和 / 或晶体来实现。 0035 将来自示例性采样器。
45、 302 的样本提供给时域频域转换器 304。图 3 的示例性时域 频域转换器304利用离散的傅里叶变换(DFT)或用于将基于时间的信息转换成基于频率的 信息 305 的任何其它适当的技术来实现。在一些示例中, 该时域频域转换器 304 可以利用 滑动DFT来实现, 其中, 每当将新样本提供给示例性时域频域转换器304并且丢弃旧样本时 就计算频域表示或频谱305。 在一些示例中, 时域频域转换器304对接收的编码音频105的 具有 18432 个样本的块, 标称地计算频域表示 305。时域频域转换器 304 生成的频域表示 305 的分辨率随着为生成频域表示 305 而使用的样本数而增加。 0。
46、036 正常地选择采样频率303和由时域频域转换器304处理的样本数, 以与编码器102 中为选择频率指数而使用的分辨率相匹配。然而, 如下所述, 由时域频域转换器 304 处理 说 明 书 CN 102237092 A CN 102237097 A7/10 页 10 的、 用于计算频域表述 305 的样本的数目可以被调节和 / 或选择成对采样频率 202( 图 2)、 接收器 110 中采用的经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进行补偿。 0037 由时域频域解码器304生成的频域表示305传递至频域解码器306,。
47、 该频域解码器 306监测与频率指数相对应的、 可以潜在地传送由示例性编码器102插入的代码103的所有 频率或谱线。示例性频域解码器 306 在接收到的音频 105 中寻找强调的代码频率的图案。 如下所述, 可以另外或另选地监测不同频率集和/或偏移频率集, 以对采样频率202(图2)、 接收器 110 中采用的用于经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进行补偿。一旦频域解码器 306 已经确定强调了哪 些代码频率, 频域解码器 306 就基于所强调的代码频率来确定存在于编码音频 105 内的符 号。频域解码器 306。
48、 可以记录这些符号, 以及 / 或可以将那些符号解码成嵌入和 / 或插入 到音频 105 中的代码 103。将是否由频域解码器 306 检测、 解码以及 / 或提取出有效代码 103 的指示 307 提供给偏移补偿器 308。 0038 在 2008 年 10 月 10 日提交的美国专利申请 No.12/249619、 2009 年 8 月 31 日提交 的美国专利申请 No.12/551220, 以及 2009 年 5 月 12 日提交的美国专利申请 No.12/464811 中描述了可以用于实现图3的示例性采样器302、 示例性时域频域转换器304以及/或示例 性频域解码器 306 的示例。
49、性方法、 装置以及制造品。虽然这些示例可能未描述从示例性偏 移补偿器 308 接收的可调和 / 或可选输入, 但代替的是, 这些示例可以根据预先选定和 / 或 预先确定的参数来实现, 本领域普通技术人员容易明白, 怎样修改这些示例, 以适应来自偏 移补偿器 308 的可调和 / 或可选输入。 0039 为了补偿频率偏移, 图 3 的示例性解码器 116 包括示例性偏移补偿器 308。当图 3 的示例性偏移补偿器 308 未接收到频域解码器 306 能够从编码音频 105 检测、 解码以及 / 或提取出代码的指示时, 该示例性偏移补偿器 308 调节以下各项中的一个或更多个 : 采样 频率 303、 时域频域转换器 304 所使用的块尺寸以及 / 或由频域解码器 306 所考虑、 检查以 及 / 或分析的代码频率。 0040 在一些示例中, 偏移补偿器308保持使得能够对代码103进行正确检测、 解码以及 / 或提取的先前频率偏移列表 310。当偏移使能适当地解码代码 103 时, 示例性偏移补偿器 308 将该偏移存储在列表 310 中。列表 310 可以包括是否调节和 / 或选择了采样率 303、 块 尺寸。