用于执行音频水印解码的方法、装置以及制造品.pdf

上传人:柴****2 文档编号:5871909 上传时间:2019-03-27 格式:PDF 页数:19 大小:571.47KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110105251.2

申请日:

2011.04.26

公开号:

CN102237092A

公开日:

2011.11.09

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的视为放弃IPC(主分类):G10L 19/018放弃生效日:20111109|||实质审查的生效IPC(主分类):G10L 19/00申请日:20110426|||公开

IPC分类号:

G10L19/00

主分类号:

G10L19/00

申请人:

尼尔森(美国)有限公司

发明人:

D·J·尼森; 韦努戈帕尔·斯里尼瓦桑; 约翰·C·派弗

地址:

美国伊利诺伊州

优先权:

2010.04.26 US 12/767,422

专利代理机构:

北京三友知识产权代理有限公司 11127

代理人:

张旭东;宋教花

PDF下载: PDF下载
内容摘要

本发明涉及用于执行音频水印解码的方法、装置以及制造品。公开了用于执行音频水印解码的示例性方法、装置以及制造品。一种公开的示例性方法包括以下步骤:接收音频信号,该音频信号包括利用第一多个频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样音频信号变换成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。

权利要求书

1.一种方法,该方法包括以下步骤:
接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;
对所述音频信号进行采样;
将所采样的音频信号变换成第一频域表示;
确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;
以及
当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多
个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多
个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
2.根据权利要求1所述的方法,其中,所述第二频域表示包括所述第一频域表示。
3.根据权利要求1所述的方法,其中,所述方法还包括:将所采样的音频信号
变换成所述第二频域表示。
4.根据权利要求1所述的方法,所述方法还包括:选择所述第二多个频率分量
中的、要与所述第一多个频率分量中的对应频率分量相邻的各频率分量。
5.根据权利要求1所述的方法,所述方法还包括:选择所述第二多个频率分量
中的第一频率分量,以具有比所述第一多个频率分量中的第一频率分量更窄的带宽。
6.根据权利要求1所述的方法,所述方法还包括:调节与所述音频信号的采样
相关联的频率,以选择所述第二多个频率分量。
7.根据权利要求1所述的方法,所述方法还包括以下步骤:当在所述第二多个
频率分量中未检测到所述代码时,检查第三频域表示的第三多个频率分量,以确定是
否检测到所述代码,所述第三多个频率分量相对于所述第一多个频率分量偏移了不同
于所述第一偏移的第二偏移,所述第二偏移对应于第二采样频率失配。
8.根据权利要求1所述的方法,所述方法还包括:基于所述第一偏移来选择将
采样音频信号变换成所述第二频域表示所使用的参数。
9.根据权利要求1所述的方法,所述方法还包括:从偏移列表中选择所述第一
偏移。
10.根据权利要求1所述的方法,所述方法还包括:当在所述第二多个频率分量
中检测到所述代码时,将所述第一偏移添加至偏移列表。
11.一种装置,该装置包括:
音频信号的音频输入接口,该音频信号包括使用第一多个频率分量嵌入的听者测
量代码;
采样器,该采样器用于对所述音频信号进行采样;
时域频域转换器,该时域频域转换器用于将所采样的音频信号变换成第一频域表
示;以及
频域解码器,该频域解码器用于确定是否能够在所述第一频域表示的所述第一多
个频率分量中检测到所述代码,并且当在所述第一多个频率分量中未检测到所述代码
时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二
多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采
样频率失配。
12.根据权利要求11所述的装置,其中,当在所述第二多个频率分量中未检测
到所述代码时,所述频域解码器检查第三频域表示的第三多个频率分量,以确定是否
检测到所述代码,所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于
所述第一偏移的第二偏移,所述第二偏移对应于第二采样频率失配。
13.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器
用于从偏移列表中选择所述第一偏移。
14.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用
于当在所述第二多个频率分量中检测到所述代码时,将所述第一偏移添加至偏移列表。
15.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用
于基于所述第一偏移来选择将采样音频信号变换成所述第二频率表示所使用的参数。
16.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器用
于选择要与所述第一多个频率分量中的对应频率分量相邻的所述第二多个频率分量。
17.根据权利要求11所述的装置,所述装置还包括偏移补偿器,该偏移补偿器
用于配置所述第二多个频率分量中的第一频率分量,以具有比所述第一多个频率分量
中的第一频率分量更窄的带宽。
18.一种存储机器可读指令的有形制造品,该机器可读指令在被执行时,使得机
器:
接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测量代码;
对所述音频信号进行采样;
将所采样的音频信号变换成第一频域表示;
确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;
以及
当在所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多
个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多
个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。
19.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器将所采样的音频信号变换成所述第二偏移表示。
20.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器选择所述第二多个频率分量中的、要与所述第一多个频率分量中的对应频
率分量相邻的各频率分量。
21.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器选择所述第二多个频率分量中的第一频率分量,以具有比所述第一多个频
率分量中的第一频率分量更窄的带宽。
22.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器调节与所述音频信号的采样相关联的频率,以选择所述第二多个频率分
量。
23.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器基于所述第一偏移来选择将采样音频信号变换成所述第二频域表示所使
用的参数。
24.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器从偏移列表中选择所述第一偏移。
25.根据权利要求18所述的有形制造品,其中,所述机器可读指令在被执行时,
使所述机器当在所述第二多个频率分量中检测到所述代码时将所述第一偏移添加至
偏移列表。

说明书

用于执行音频水印解码的方法、装置以及制造品

技术领域

本公开总体上涉及媒体监测,并且更具体地说,涉及用于执行音频水印解码的方
法、装置以及制造品。

背景技术

标识媒体内容(例如,电视(TV)节目、无线电节目、广告、评论、音频/视频
内容、电影、商业广告节目、广告等)有用于评价对这种内容的视听者接触率
(exposure)。例如,在视听者计量应用中,可以将代码或水印插入或嵌入媒体内容的
音频或视频(例如,节目或广告)中,其中,随后在呈现(例如,在受监测家庭播放)
该媒体内容时在一个或更多个监测点处检测代码/水印。嵌入到原始信号中的代码/水
印的信息净荷可以包括独特节目标识、源标识、广播方信息,以及/或广播时间。监
测点可以包括诸如家庭、商店、营业地点以及/或任何其它公共和/或私人机构的场所,
其中,监测媒体内容接触率和/或媒体内容消费量。例如,在监测点,捕获来自音频
和/或视频的代码/水印。可以将所收集的代码/水印发送给中心数据收集机构,以对诸
如内容消费统计的计算进行分析。

发明内容

本发明提供一种用于执行音频水印解码的方法、装置以及制造品。

本发明提供的方法包括以下步骤:接收音频信号,该音频信号包括使用第一多个
频率分量嵌入的听者测量代码;对所述音频信号进行采样;将所采样的音频信号变换
成第一频域表示;确定是否能够在所述第一频域表示的所述第一多个频率分量中检测
到所述代码;以及当在所述第一多个频率分量中未检测到所述代码时,检查第二频域
表示的第二多个频率分量,以确定是否检测到所述代码,所述第二多个频率分量相对
于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采样频率失配。

本发明提供的装置包括:音频信号的音频输入接口,该音频信号包括使用第一多
个频率分量嵌入的听者测量代码;采样器,该采样器用于对所述音频信号进行采样;
时域频域转换器,该时域频域转换器用于将所采样的音频信号变换成第一频域表示;
以及频域解码器,该频域解码器用于确定是否能够在所述第一频域表示的所述第一多
个频率分量中检测到所述代码,并且当在所述第一多个频率分量中未检测到所述代码
时,检查第二频域表示的第二多个频率分量,以确定是否检测到所述代码,所述第二
多个频率分量相对于所述第一多个频率分量偏移了第一偏移,所述第一偏移对应于采
样频率失配。

本发明提供了一种存储机器可读指令的有形制造品,该机器可读指令在被执行
时,使得机器:接收音频信号,该音频信号包括使用第一多个频率分量嵌入的听者测
量代码;对所述音频信号进行采样;将所采样的音频信号变换成第一频域表示;确定
是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码;以及当在
所述第一多个频率分量中未检测到所述代码时,检查第二频域表示的第二多个频率分
量,以确定是否检测到所述代码,所述第二多个频率分量相对于所述第一多个频率分
量偏移了第一偏移,所述第一偏移对应于采样频率失配。

附图说明

图1是采用嵌入到复合电视信号的音频部分中的识别码的示例性广播视听者测
量系统的示意图。

图2例示了实现图1的示例性编码器的示例性方式。

图3例示了实现图1的示例性解码器的示例性方式。

图4和5例示了可以例如通过处理器来执行的、用于实现图1和图3的示例性解
码器的示例性处理。

图6A和6B例示了可以通过图3的示例性解码器进行补偿的示例性频率偏移。

图7是可以用于和/或编程为实现图4和图5的、用于实现对图1和图3的示例
性解码器和/或示例性偏移补偿器的示例性处理的示例性处理器平台的示意图。

具体实施方式

公开了用于执行音频水印解码的示例性方法、装置以及制造品。所公开的示例性
方法包括以下步骤:接收音频信号,该音频信号包括使用第一多个频率分量嵌入其中
的听者测量代码;对该音频信号进行采样;将所采样的音频信号变换成第一频域表示;
确定是否能够在该第一频域表示的第一多个频率分量中检测到该代码;以及当在第一
多个频率分量中未检测到该代码时,检查第二频域表示的第二多个频率分量,以确定
是否检测到该代码,该第二多个频率分量相对于第一多个频率分量偏移了第一偏移,
该第一偏移对应于采样频率失配。

所公开的示例性装置包括:对音频信号的音频输入接口,该音频信号包括使用第
一多个频率分量嵌入其中的听者测量代码;采样器,该采样器用于对音频信号进行采
样;时域频域转换器,该时域频域转换器用于将所采样的音频信变换成第一频域表示;
以及频域解码器。该频域解码器用于确定是否能够在该第一频域表示的第一多个频率
分量中检测到该代码;并且当在第一多个频率分量中未检测到该代码时,检查第二频
域表示的第二多个频率分量,以确定是否检测到该代码,该第二多个频率分量相对于
第一多个频率分量偏移了第一偏移,该第一偏移对应于采样频率失配。

下列描述分别提及音频编码和解码,该音频编码和解码还被称为音频水印印制和
水印检测。应注意到,关于这点,音频是具有落入正常人类声频谱内的频率的任何类
型的信号。例如,音频可以是语音、音乐、音频和/或视频节目(例如,电视(TV)
节目、电影、因特网视频、无线电节目、插播商业广告等)的音频部分、噪音,或任
何其它声音。

一般来说,对音频进行编码指将一个或更多个代码插入该音频中。在一些示例中,
该代码被心理声学地掩盖,以使得该代码对于音频的人类听者来说是听不见的。然而,
可能存在该代码对于某些人类收听者来说听得见的某些情况。这些代码还可以被称为
水印。嵌入到音频中的这些代码可以具有任何适当的长度,并且可以利用用于将信息
(例如,信道标识符、站标识符、广播方标识符、内容创建者标识符、内容拥有者标
识符、节目标识符、时间戳、广播标识符等)映射至这些代码的任何适当的技术。而
且,可以将这些代码转换成由嵌入到音频中的、具有选定频率的信号所表示的符号。
任何适当的进行编码和/或纠错的技术都可以用于将代码转换成符号。这种听者测量
代码的一些示例包括Nielsen公司(美国)、LLC、本专利的受让人所有的Nielsen码。
Nielsen码是由Nielsen公司(美国)、LLC、Nielsen公司(美国)的任何分支机构或
LLC的任何分支机构嵌入到任何媒体内容中的任何代码,和/或与Nielsen公司(美国)、
LLC或与Nielsen公司(美国)的任何分支机构、LLC的任何分支机构相关联地嵌入
到任何媒体内容中的任何代码。在于此描述的示例中,在发送和/或广播之前,和/或
发送和/或广播期间,将媒体内容编码成包括一个或更多个这种代码。当在内容呈现
设备上呈现(例如,通过TV、无线电、计算设备、蜂窝电话、手持设备,以及/或任
何其它适当设备播放)媒体内容时,处于呈现区域中的人不仅接触该媒体内容,而且
不为他们所知的是,还接触了嵌入到该媒体内容中的代码。

虽然参照包括嵌入了和/或编码到其音频部分中的代码的广播音频/视频媒体内容
(例如,TV节目、商业广告节目、电影等)对以下示例进行描述,但这种示例仅是
例示性的。例如,代码可以附加地或另选地嵌入和/或编码到其它类型的媒体内容,
诸如但不限于音频内容、视频内容、图形内容、图像、游戏、调查(survey),以及/
或网页。而且,在此描述的方法和装置可以用于检测嵌入到任何数量和/或类型的附
加地和/或另选的媒体内容(例如,无线电广播、音频通知等)中的代码。而且,媒
体内容不需要广播。例如,媒体内容可以经由任何数量和/或类型的有形介质(如包
括嵌入代码的数字万用盘(DVD)和/或光盘(CD))来散布。

图1示出了示例性编码与解码系统100。图1的示例性系统100描绘了示例性电
视观众测量系统,其将用作进一步描述在此公开的示例性解码处理的情境。图1的示
例性系统100包括编码器102,该编码器102将代码103添加至音频信号104,来生
成编码音频信号105。代码103可以表示任何期望的或选定的信息。例如,在媒体监
测背景下,代码103可以表示诸如电视广播、无线电广播等的广播媒体内容的标识。
另外,代码103可以包括指示将该代码103插入到音频中的时间或媒体广播时间的定
时信息。

音频信号104可以是任何形式的音频,例如包括话音、音乐、噪音、商业广告音
频、与电视节目、现场演奏等相关联的音频。在图1的示例中,编码器102将编码音
频信号105传递至发送器106。该发送器106将编码音频信号105连同与该编码音频
信号105相关联的任何视频信号108一起发送。在一些情况下,虽然编码音频信号
105可能具有关联的视频信号108,但编码音频信号105不需要具有任何关联的视频。

尽管图1所示示例性系统100的发送侧示出了单个发送器106,但该发送侧可以
更加复杂,并且可以包括在可以传递音频信号104的散布链中的多个级。例如,该音
频信号104可以在全国网络级生成并且向局部网络级传递以进行局部散布。因此,尽
管在发送器106之前的发送队列中示出了编码器102,但可以在音频信号104的整个
散布链放置一个或更多个编码器。因此,音频信号104可以按多个级来编码并且可以
包括与那些多个级相关联的多个嵌入代码。下面,结合图2,对实现示例性编码器102
的示例性方式进行描述。

图1的示例性发送器106可以包括:可以通过自由空间传播(例如,经由陆地或
卫星通信链路)散布编码音频信号的一个或更多个射频(RF)发送器,或者用于通
过电缆、光纤等散布编码音频信号的发送器。在一些示例中,发送器106用于遍及广
的地理区域广播编码音频信号105。在其它情况下,发送器106可以通过有限的地理
区域散布编码音频信号105。这种发送可以包括将编码音频信号105上变频至射频,
以能够传播编码音频信号105。另选的是,该发送可以包括散布采用数字值或数字值
包形式的编码音频信号105,该数字值或数字值包可以通过一个或更多个网络(如因
特网、广域网、和/或局域网)进行发送。因而,编码音频信号105可以通过载波信
号、通过信息包和/或通过任何适当的技术来传送,以散布音频和/或视频信号。

当通过接收器110(在媒体监测的情境下,该接收器110可位于统计上选定的计
量点112处)接收示例性的编码音频信号105时,对该音频信号105进行处理以恢复
代码103,即使在通过接收器110的扬声器114呈现编码音频信号105时,收听者觉
察不到(或大致觉察不到)代码103的存在。为此,解码器116直接连接至接收器
110处可用的音频输出部118,或者连接至放置在再现音频105的扬声器114附近的
麦克风120。所接收音频信号105可以是单声道格式或者立体声格式。下面,结合图
3,对实现图1的示例性解码器116的示例性方式进行描述。

图2例示了实现图1的示例性编码器102的示例性方式。如上所述,图2的示例
性编码器102将一个或更多个听不见(或大致听不见)的代码103插入到音频104
中,以创建编码音频105。在图2所示的示例中,编码器102包括采样器201,该采
样器201用于按采样频率202对音频104进行采样,以形成采样的音频信号203。将
示例性采样器201耦接至掩蔽估算器(masking evaluator)204,其估算音频104将代
码103隐藏在其中的能力。代码103被提供给代码频率选择器206,代码频率选择器
206确定或选择将代码103插入或嵌入到采样的音频203中所使用的频率。代码频率
选择器206可以利用任何适当的检测或校正编码将代码103转换成符号。将对指定或
选定的代码频率(该代码频率用于呈现代码103)的指示207传递至掩蔽估算器204,
以使该掩蔽估算器204获知该频率,针对该频率应当确定通过音频104对代码103
的掩蔽。另外,将对代码频率的指示207提供给代码合成器208,该代码合成器208
生成具有代码频率选择器206所指定的频率的正弦波信号209。组合器210接收来自
代码合成器208的合成的代码频率209和向采样器提供的音频104,并将这两者进行
组合以生成编码音频105。

在以模拟形式将音频104提供给编码器102的一些示例中,示例性采样器201
利用模拟数字转换器或任何其它适当的数字转换器来实现。采样器201可以以例如
48000赫兹(Hz)或适于满足Nyquist标准的任何其它采样率对音频104进行采样。
例如,如果将音频104频率上限制在15000Hz,则采样器201可以以30000Hz的采
样频率202来操作。来自采样器201的各样本203可以通过数字比特串来表示,其中,
比特数表示音频104被采样的精度。例如,采样器201可以生成8比特、16比特、
24比特,或32比特值302。

除了对音频104进行采样以外,图2的示例性采样器201将要一起处理的许多样
本(即,音频块)进行累积。例如,示例性采样器201一次可以累积向掩蔽估算器
204传递的512个样本音频块。另选的是,掩蔽估算器204可以包括累加器,在该累
加器中,在音频块被处理之前将它们累积在缓冲区中。

图2的示例性掩蔽估算器204接收或累积这些样本(即,512个样本),并确定
所累积的样本的向人类听力大致隐藏代码频率的能力。即,掩蔽估算器204例如通过
整体估算音频104的各临界频带以确定其能量,并确定各临界频带的类似噪声或类似
音调的属性以及确定这些临界频带掩蔽代码频率的总体能力,来确定这些代码频率是
否可以隐藏在由所累积的样本表示的音频104内。临界频带(其可以通过对人类听知
觉执行的实验研究来确定)在宽度上可以从频谱低端处的窄频带至声频谱高端处更宽
频带进行改变。如果掩蔽估算器204确定可以将代码频率隐藏在音频104中,则掩蔽
估算器204指示可以将代码频率插入到音频104内的振幅等级,同时仍保持大致隐藏,
并向代码合成器208提供振幅信息。

在一些示例中,代码频率选择器206利用将输入代码103与状态相联系的查寻表
来实现,在该查寻表中,各状态表示要在编码音频信号105中强调的许多代码频率。
换句话说,可以根据代码频率映射表将输入代码103映射至代码频率。代码频率选择
器206可以包括将符号或数据状态与冗余地表示数据状态的代码频率集相联系的信
息。选定的供使用的状态的数目可以基于输入代码103的类型。例如,可以将包含两
个比特的输入代码103转换成表示四个符号或状态(例如,22)中的一个的代码频率。
在其它示例中,包含四比特信息的输入代码103由16个符号或状态(例如,24)中
的一个表示。在将代码103转换成一个或更多个符号或状态时,可以附加地或另选地
使用一些其它编码来加入纠错。另外,在一些示例中,可以将一个以上代码103嵌入
到音频104中。

当经由采样块的傅里叶变换而在频域中表示音频信号104时,利用代码频率映射
表选定的频率指数对应于要嵌入到音频信号104中的正弦波频率。参考频率指数而不
是实际频率,这是因为这些指数所对应的频率基于编码器102内使用的采样率202
和由解码器116处理的采样数而变。与相邻指数对应的相邻频率之间的间隔与采样频
率202和音频块尺寸的比率成比例。例如,以48000Hz的采样率和18432个样本的
音频块尺寸,相邻指数之间的间距约为2.6Hz。因而,频率指数360对应于936Hz
(2.6Hz×360)。当然,可以选择其它采样率和块尺寸,由此可以选择其它频率间隔。
而且,不是所有频率指数都需要用于例如避免与用于传送其它代码和/或水印的频率
的干扰。而且,所选定和/或使用的频率范围不需要连续。在一些示例中,使用0.8kHz
至1.03kHz与2.9kHz至4.6kHz范围内的频率。在其它示例中,使用0.75kHz至1.03
kHz与2.9kHz至4.4kHz范围内的频率。

图2的示例性代码合成器208从代码频率选择器206接收对要包括频率指数的指
示207,以创建包括对输入代码103的表示的编码音频信号105。响应于对频率指数
的指示207,代码合成器208生成具有所识别的频率的许多正弦波(或包括多个正弦
波的一个复合信号)。这种合成可以导致正弦波信号或者导致表示正弦波信号的数字
数据。在一些示例中,代码合成器208生成具有由掩蔽估算器204所指示的振幅的代
码频率。在其它示例中,代码合成器208生成具有固定振幅的代码频率,并且那些振
幅可以通过在代码合成器208内实现的或者设置在代码合成器208与组合器210之间
的一个或更多个增益块(未示出)来调节。

虽然前面描述了生成正弦波或表示正弦波的数据的示例性代码合成器208,但代
码合成器的其它示例性实现也是可以的。例如,另一示例性代码合成器208不是生成
正弦波,而是可以输出频域系数,该频域系数用于调节提供给组合器210的特定音频
频率的振幅。以这种方式,可以将音频104的频谱调节成包括必要的正弦波。

图2的示例性组合器210接收代码合成器208的输出209和音频104两者,并将
它们进行组合以形成编码音频105。组合器210可以以模拟或数字形式来组合代码合
成器208的输出209和音频104。如果组合器210执行数字组合,则代码合成器208
的输出209可以与采样器201的输出相组合,而不是与输入至采样器201的模拟音频
104相组合。例如,数字形式的音频块可以与数字形式的正弦波相组合。另选的是,
该组合可以在频域执行,其中,音频104的频率系数根据表示正弦波的频率系数来调
节。作为另一另选例,可以以模拟形式组合正弦波和音频104。编码音频105可以以
模拟或数字形式从组合器210输出。如果组合器210的输出105是数字的,则可以在
将其耦接至发送器106之前随后将其转换成模拟形式。

在2008年10月10日提交的美国专利申请No.12/249619、2009年8月31日提
交的美国专利申请No.12/551220,以及2009年5月12日提交的美国专利申请No.
12/464811中描述了可以用于选择代码频率、通过音频104分析对嵌入代码的掩蔽,
以及/或实现代码频率映射表的示例性方法、装置以及制造品、示例性采样器201、示
例性掩蔽估算器204、示例性代码频率选择器206、示例性代码合成器208、示例性
组合器210和/或示例性编码器102,通过引用将各专利申请的全部内容合并入于此。

图3例示了实现图1的实例解码器116的示例性方式。图3的实例解码器116对
插入到音频104中的代码103进行检测、解码以及/或提取,以在编码器102处形成
编码音频105。如图1所示,编码音频105可以经由有线和/或无线连接提供至接收器
110。而在下列描述中,为了容易理解而假定解码器116基本上处理由编码器102形
成的同一编码音频105,一般来说,由解码器116处理的音频例如由于发送器106、
接收器110以及/或任何介入的传输媒体所引入的失真、噪声等而不同。因此,实际
上,这种影响通过执行任何数量和/或类型的适当的噪声缩减、失真减轻以及/或纠错
技术来进行控制。

图3的示例性解码器116包括采样器302,以模拟形式向该采样器302提供编码
音频105,该采样器302可以利用模拟数字转换器或任何其它适当的技术来实现。图
3的示例性采样器302例如以48000Hz的标称采样频率303对编码音频105进行采
样。当然,可以有利地选择更低的采样频率,以便在解码时降低计算负荷。然而应当
将采样频率303选择成满足Nyqusit标准。而且,如下所述,可以将采样频率303调
节和/或选择成对采样频率202(图2)、接收器110中采用的用于经由扬声器114输
出编码音频105的采样频率、和/或采样频率303中的任一个或全部之间的任何失配
进行补偿。这种采样频率失配和/或差异可以导致嵌入的代码103在解码器116中以
错误的代码频率出现,并由此可以削弱解码器116正确地解码、检测以及/或提取代
码103的能力。采样频率失配可能例如因在接收器114和/或解码器116中使用低成
本晶体和/或因导致谐振频率漂移的晶体老化而造成。低成本晶体通常在消费级装置
(如个人计算机(PC))或机顶盒中发现,其中,从理想中心频率的轻微漂移对人耳
不易察觉,但可能影响对嵌入的代码的检测、解码和/或提取。通常,编码器102利
用准确的时基和/或晶体来实现。

将来自示例性采样器302的样本提供给时域频域转换器304。图3的示例性时域
频域转换器304利用离散的傅里叶变换(DFT)或用于将基于时间的信息转换成基于
频率的信息305的任何其它适当的技术来实现。在一些示例中,该时域频域转换器
304可以利用滑动DFT来实现,其中,每当将新样本提供给示例性时域频域转换器
304并且丢弃旧样本时就计算频域表示或频谱305。在一些示例中,时域频域转换器
304对接收的编码音频105的具有18432个样本的块,标称地计算频域表示305。时
域频域转换器304生成的频域表示305的分辨率随着为生成频域表示305而使用的样
本数而增加。

正常地选择采样频率303和由时域频域转换器304处理的样本数,以与编码器
102中为选择频率指数而使用的分辨率相匹配。然而,如下所述,由时域频域转换器
304处理的、用于计算频域表述305的样本的数目可以被调节和/或选择成对采样频率
202(图2)、接收器110中采用的经由扬声器114输出编码音频105的采样频率、和
/或采样频率303中的任一个或全部之间的任何失配进行补偿。

由时域频域解码器304生成的频域表示305传递至频域解码器306,该频域解码
器306监测与频率指数相对应的、可以潜在地传送由示例性编码器102插入的代码
103的所有频率或谱线。示例性频域解码器306在接收到的音频105中寻找强调的代
码频率的图案。如下所述,可以另外或另选地监测不同频率集和/或偏移频率集,以
对采样频率202(图2)、接收器110中采用的用于经由扬声器114输出编码音频105
的采样频率、和/或采样频率303中的任一个或全部之间的任何失配进行补偿。一旦
频域解码器306已经确定强调了哪些代码频率,频域解码器306就基于所强调的代码
频率来确定存在于编码音频105内的符号。频域解码器306可以记录这些符号,以及
/或可以将那些符号解码成嵌入和/或插入到音频105中的代码103。将是否由频域解
码器306检测、解码以及/或提取出有效代码103的指示307提供给偏移补偿器308。

在2008年10月10日提交的美国专利申请No.12/249619、2009年8月31日提
交的美国专利申请No.12/551220,以及2009年5月12日提交的美国专利申请No.
12/464811中描述了可以用于实现图3的示例性采样器302、示例性时域频域转换器
304以及/或示例性频域解码器306的示例性方法、装置以及制造品。虽然这些示例可
能未描述从示例性偏移补偿器308接收的可调和/或可选输入,但代替的是,这些示
例可以根据预先选定和/或预先确定的参数来实现,本领域普通技术人员容易明白,
怎样修改这些示例,以适应来自偏移补偿器308的可调和/或可选输入。

为了补偿频率偏移,图3的示例性解码器116包括示例性偏移补偿器308。当图
3的示例性偏移补偿器308未接收到频域解码器306能够从编码音频105检测、解码
以及/或提取出代码的指示时,该示例性偏移补偿器308调节以下各项中的一个或更
多个:采样频率303、时域频域转换器304所使用的块尺寸以及/或由频域解码器306
所考虑、检查以及/或分析的代码频率。

在一些示例中,偏移补偿器308保持使得能够对代码103进行正确检测、解码以
及/或提取的先前频率偏移列表310。当偏移使能适当地解码代码103时,示例性偏移
补偿器308将该偏移存储在列表310中。列表310可以包括是否调节和/或选择了采
样率303、块尺寸以及/或代码频率来实现该偏移。在这种示例中,偏移补偿器310
在尝试其它偏移之前首先可以尝试先前成功的偏移310,以获得对代码103的适当解
码。通过首先尝试先前成功的偏移310,可以减少开始解码代码103所需的时间。可
以将列表310存储在非易失性存储器中,以使先前成功的偏移能够在断电之后和/或
重新初始化解码器116之后能够被重新调用。

在一些示例中,偏移补偿器308通过成功扰动一个或更多个参数(例如,采样率
303、块尺寸和/或代码频率)来尝试偏移,例如直到代码103被成功解码或达到预定
限制为止。例如,采样率303可以按1Hz或2Hz增量增加,直到代码103被成功解
码或者达到为生成采样频率303而使用的时钟312的调谐范围限制为止。如果达到调
谐范围限制,则采样率303可以重置成其标称值,并接着以1Hz或2Hz的减量减小。

在其它示例中,可以解码诸如Nielsen NAES II的另外容错码,以确定粗略频率
偏移与用于使得能够对更复杂代码(诸如Nielsen NAES V和NAES VI代码)进行解
码的随后的精细频率偏移调节。例如,NAES II和NAES V以及/或NAES VI代码可
以同时存在。首先可以解码NAES II代码以确定粗略偏移,随后检测NAES V和/或
VI代码以进一步精炼频率偏移。在其它示例中,仅存在NAES II代码的训练相后面
有NAES V和/或VI代码。可以同样尝试对块尺寸和/或代码频率的调节和/或选择。

图6A描绘了具有以多个频率嵌入到音频104中的代码的示例,该多个频率中的
一个指定了标号605。在编码器102处,频率605对应于相应编码器频域箱(bins)
和/或指数,频域箱(bins)和/或指数中的一个指定了标号610。

采样频率202(图2)、接收器110中采用的用于经由扬声器114输出编码音频
105的采样频率、和/或采样频率303中的任一个或全部之间的失配可以造成编码器
102嵌入代码103所在的频率与那些嵌入代码103出现在解码器116处所在的频率之
间的不一致,如图6B所示。例如,由于该失配,图6A中在编码器频率605嵌入的
代码信息在解码器116处出现在偏移频率615,如图6B所示。因而,该代码信息不
是以频域箱和/或指数610出现,而是以频域箱和/或指数620出现。传送代码信息的
其它频率同样偏移。这些代码频率偏移可以导致解码出错。

在此描述用于补偿这种偏移的许多示例性方法。在一些示例中,调节和/或选择
(例如,从采样频率的标称值起增加或减小)采样频率303,直到以适当的保真度在
标称频率箱中检测到代码103为止。在其它示例中,使用偏移频率箱集来检测和解码
代码103。例如,如果期望代码在标称频率指数{12,20,56},则频域解码器306例
如可以检查偏移频率指数{13,21,57}、{11,19,55}、{14,22,58}等,直到以适
当的保真度检测到代码103为止。在一些示例中,在校准期间可以使用已知代码,以
易于确定代码检测保真度。在其它样本中,可将解码度量(如标准化能之和、解码有
效性验证、解码评分(score)等)与已知和/或未知代码一起使用,以确定和/或估计
解码保真度。

另外或另选的是,可以调节和/或选择时域频域转换器304所使用的、用于计算
频域表示305的块尺寸。例如,可以通过两倍系数来增加该块尺寸,来使得可能检测
到代码信息的频率指数的数加倍。这样,如果频率偏移使代码信息移动至靠近两个频
率指数之间的边界,则可以以增加保真度检测到该代码信息。当然,可以使用上述方
法的任意组合。

虽然在图3中例示了实现图1的示例性解码器116的示例性方式,但可以按任何
其它方式组合、拆分、重新布置、省略、消除以及/或实现图3所示接口、数据结构、
元件、处理以及/或设备中的一个或更多个。而且,示例性采样器302、示例性时域频
域转换器304、示例性频域解码器306、示例性偏移补偿器308以及/或更上位地示例
性解码器116中的任一个都可以用一个或更多个电路、设备、可编程处理器、ASIC、
PLD、FPLD、以及/或FPGA等来实现。当阅读本专利的并入了这些组成部分中的
一个或更多个的任何装置权利要求以覆盖纯软件和/或固件实现时,示例性采样器
302、示例性时域频域转换器304、示例性频域解码器306、示例性偏移补偿器308
以及/或更上位地示例性解码器116中的至少一个由此被明确地限定成包括存储固件
和/或软件的有形计算机可读介质。更进一步地,代替图3所示那些或除了图3所示
那些之外,示例性解码器116可以包括接口、数据结构、元件、处理以及/或设备,
以及/或可以包括任何或全部所示接口、数据结构、元件、处理以及/或设备中的一
个以上。

图4和5例示了可以执行以实现图1和图3的示例性解码器116的示例性处理。
可以将处理器、控制器以及/或任何其它适当的处理设备用于和/或编程成执行图4和/
或图5的示例性处理。例如,可以将图4和/或图5的处理体现在编码指令中,该编
码指令存储在有形计算机可读介质(如闪速存储器、CD、DVD、软盘、只读存储器
(ROM)、随机存取存储器(RAM)、闪速存储器、可编程ROM(PROM)、电可编
程ROM(EPROM),以及/或电可擦除PROM(EEPROM))、光学存储盘、光学存储
设备、磁存储盘、磁存储装置,以及/或可以用于存储机器可读指令或数据结构形式
的程序代码和/或指令的任何其它有形介质,并且该编码指令可以通过处理器、计算
机以及/或具有处理器的其它机器(如下面结合图7讨论的示例性处理器平台P100)
进行访问。另选的是,图4和/或图5的示例性处理中的一些或全部可以通过ASIC、
PLD、FPLD、PFGA、离散逻辑、硬件、固件等的任意组合来实现。而且,图4和/
或图5的示例性处理中的一些或全部可以手动实现或者实现为任何前述技术的任意
组合,例如,固件、软件、离散逻辑和/或硬件的任意组合。而且,可以采用实现图4
和/或图5的示例性处理的许多其它方法。例如,可以改变框的执行次序,和/或可以
将描述的框中的一个或更多个进行改变、消除、再拆分,或组合。此外,图4和/或
图5的示例性处理中的任何或全部例如可以顺序地执行和/或通过分隔处理线程、处
理器、设备、离散逻辑、电路等并行地执行。

图4的示例性处理从示例性采样器302对接收到的编码音频105进行采样开始
(框405)。音频105可以经由音频传感器、硬布线连接,经由音频文件,或者通过
任何其它适当的技术来获取。如上所描述的,可以在48000Hz,或者在任何其它适
当的频率来执行采样。

在获取各样本的同时,对包括许多旧样本和在框405获取的新添样本的样本集执
行滑动时间频率变换(框410),在一些示例中,将滑动DFT用于对包括18431个旧
样本和一个新添样本的流输入样本进行处理。在一些示例中,利用18432个样本的
DFT导致具有2.6Hz的分辨率的频域表示305。

在通过时间频率转换(框410)获取频域表示305之后,示例性频域解码器306
监测针对嵌入的代码103的代码频率,并且对任何检测到的代码进行解码(框415)。

如果由偏移补偿器308选定以及/或进行的频率调节使得当前频域表示305可以
被重新处理(例如,用于检查不同的偏移频率集)(框425),则控制返回至框415,
以执行附加频域解码,假定频域解码器306和/或偏移补偿器308能够在编码音频105
的连续样本之间完成它们的操作一次以上。

如果频率调节使得当前频域表示305不能被重新处理(例如,由于采样频率303
和/或块尺寸的改变)(框425),则控制返回至框405,以在需要时收集一个或更多
个另外的音频样本。例如,如果改变采样频率303,则放弃整个缓冲区的音频样本,
并在计算下一个频域表示305之前以新的采样频率303将缓冲区充满新的音频样本。
例如,如果增加块尺寸,则在可以计算更大的频域表示305之前,可能需要收集一
个或更多个另外的音频样本。然而,如果采样器302和/或时域频域转换器304保持
额外的音频样本(例如,具有足够大的缓冲区),则可以根据时域频域转换器304、
频域解码器306以及/或偏移补偿器308的在编码音频105的连续样本之间完成它们
的操作一次以上的处理能力,立即利用已经可用的音频样本来计算更大的频域表示
305。

根据在框415是否检测到任何代码103,示例性偏移补偿器308例如通过执行图
5的示例性处理,来调节和/或选择频率偏移。接着,控制返回至框415,以处理下一
个样本块。

在示例性频域解码器306尝试对嵌入的代码103进行解码时,执行图5的示例性
处理。如果频域解码器306不能够检测到并解码嵌入的代码103(框505),则偏移补
偿器308确定是否已经尝试了在列表310中存储的所有先前成功的偏移(框510)。
如果没有尝试完所有存储的偏移310(框510),则偏移补偿器308选择下一个存储的
偏移310(框515),对应地配置采样频率303、块尺寸以及/或代码频率(框520),
并且设置标志,以指示已经将正在尝试的当前偏移存储在了列表310中。接着,控制
从图5的示例性处理退出。

返回至框510,如果已经尝试了所有存储的偏移310(框510),则偏移补偿器308
选择以及/或计算新的偏移以进行尝试(框530),并且清除标志,以指示正在尝试新
的偏移(框535)。例如,根据任何数量和/或类型的搜索标准、步骤尺寸以及/或图案,
可以尝试标称频率指数的连续偏移,可以尝试采样频率303的连续改变,以及/或可
以尝试块尺寸的连续改变。接着,控制从图5的示例性处理退出。

返回至框505,如果代码被成功地解码(框505),并且未设置标志(框540),
则将当前偏移存储在列表310中(框545),并且设置标志(框550)。接着,控制从
图5的示例性处理退出。返回至框550,如果设置了标志(框550),则控制从图5
的示例性处理退出,而不需要将偏移存储在列表310中。

图7是可以用于和/或编程成执行图4和图5的示例性处理并且/或用于实现图1
和图3的示例性解码器116的示例性处理器平台P100的示意图。可以使用一个或更
多个通用处理器、处理器核、微控制器等来实现该处理器平台P100。

图7的示例的处理器平台P100包括至少一个可编程处理器P105。该处理器P105
例如可以实现图3的偏移补偿器310。处理器P105执行处理器P105的主存储器中(例
如,RAM P115和/或ROM P120内)存在的编码指令P110和/或P112。处理器P105
可以是任何类型的处理单元,如处理器核、处理器以及/或微控制器。除了其它方面,
处理器P105可以执行图4和图5的示例性处理,以对本文所述的音频水印进行解码。
因而,编码指令P102、P112可以包括表示图4和图5的示例性处理的指令。

处理器P105经由总线P125与主存储器(包括ROM P120和/或RAM P115)通
信。RAM P115可以由动态随机存取存储器(DRAM)、同步动态随机存取存储器
(SDRAM),以及/或任何其它类型的RAM设备来实现,而ROM可以由闪速存储器
和/或任何其它所希望的类型的存储器设备来实现。对存储器P115和存储器P120的
访问可以由存储器控制器来控制。示例性存储器P115例如可以用于实现示例性偏移
数据库310(图3)。

处理器平台P100还包括接口电路P130。任何类型的接口标准(如外部存储器接
口、串行端口、通用输入/输出等)可以实现接口电路P130。一个或更多个输入设备
P135和一个或更多个输出设备P140连接至接口电路P130。示例性输入设备P135例
如可以用于实现示例性采样器302。

尽管在此对具体示例性方法、装置以及制造品进行了描述,但本专利的覆盖范围
并不限于此。与此相反,本专利在字面上或者在等同物原则下,覆盖清楚地落入本专
利的权利要求书范围内的所有方法、装置以及制造品。

用于执行音频水印解码的方法、装置以及制造品.pdf_第1页
第1页 / 共19页
用于执行音频水印解码的方法、装置以及制造品.pdf_第2页
第2页 / 共19页
用于执行音频水印解码的方法、装置以及制造品.pdf_第3页
第3页 / 共19页
点击查看更多>>
资源描述

《用于执行音频水印解码的方法、装置以及制造品.pdf》由会员分享,可在线阅读,更多相关《用于执行音频水印解码的方法、装置以及制造品.pdf(19页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102237092 A (43)申请公布日 2011.11.09 CN 102237092 A *CN102237092A* (21)申请号 201110105251.2 (22)申请日 2011.04.26 12/767,422 2010.04.26 US G10L 19/00(2006.01) (71)申请人 尼尔森 ( 美国 ) 有限公司 地址 美国伊利诺伊州 (72)发明人 DJ尼森 韦努戈帕尔斯里尼瓦桑 约翰C派弗 (74)专利代理机构 北京三友知识产权代理有限 公司 11127 代理人 张旭东 宋教花 (54) 发明名称 用于执行音频水印解码的方法、 装置。

2、以及制 造品 (57) 摘要 本发明涉及用于执行音频水印解码的方法、 装置以及制造品。公开了用于执行音频水印解码 的示例性方法、 装置以及制造品。 一种公开的示例 性方法包括以下步骤 : 接收音频信号, 该音频信 号包括利用第一多个频率分量嵌入的听者测量代 码 ; 对所述音频信号进行采样 ; 将所采样音频信 号变换成第一频域表示 ; 确定是否能够在所述第 一频域表示的所述第一多个频率分量中检测到所 述代码 ; 以及当在所述第一多个频率分量中未检 测到所述代码时, 检查第二频域表示的第二多个 频率分量, 以确定是否检测到所述代码, 所述第二 多个频率分量相对于所述第一多个频率分量偏移 了第一偏移。

3、, 所述第一偏移对应于采样频率失配。 (30)优先权数据 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 10 页 附图 6 页 CN 102237097 A1/2 页 2 1. 一种方法, 该方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及 当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多个频 率分量, 以确定是。

4、否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分 量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 2. 根据权利要求 1 所述的方法, 其中, 所述第二频域表示包括所述第一频域表示。 3. 根据权利要求 1 所述的方法, 其中, 所述方法还包括 : 将所采样的音频信号变换成所 述第二频域表示。 4. 根据权利要求 1 所述的方法, 所述方法还包括 : 选择所述第二多个频率分量中的、 要 与所述第一多个频率分量中的对应频率分量相邻的各频率分量。 5. 根据权利要求 1 所述的方法, 所述方法还包括 : 选择所述第二多个频率分量中的第 一频率分量, 以具有比所述第一多个频率分。

5、量中的第一频率分量更窄的带宽。 6. 根据权利要求 1 所述的方法, 所述方法还包括 : 调节与所述音频信号的采样相关联 的频率, 以选择所述第二多个频率分量。 7. 根据权利要求 1 所述的方法, 所述方法还包括以下步骤 : 当在所述第二多个频率分 量中未检测到所述代码时, 检查第三频域表示的第三多个频率分量, 以确定是否检测到所 述代码, 所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移 的第二偏移, 所述第二偏移对应于第二采样频率失配。 8. 根据权利要求 1 所述的方法, 所述方法还包括 : 基于所述第一偏移来选择将采样音 频信号变换成所述第二频域表示所使用的参数。

6、。 9. 根据权利要求 1 所述的方法, 所述方法还包括 : 从偏移列表中选择所述第一偏移。 10. 根据权利要求 1 所述的方法, 所述方法还包括 : 当在所述第二多个频率分量中检测 到所述代码时, 将所述第一偏移添加至偏移列表。 11. 一种装置, 该装置包括 : 音频信号的音频输入接口, 该音频信号包括使用第一多个频率分量嵌入的听者测量代 码 ; 采样器, 该采样器用于对所述音频信号进行采样 ; 时域频域转换器, 该时域频域转换器用于将所采样的音频信号变换成第一频域表示 ; 以及 频域解码器, 该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频 率分量中检测到所述代码, 并且。

7、当在所述第一多个频率分量中未检测到所述代码时, 检查 第二频域表示的第二多个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量 相对于所述第一多个频率分量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 12. 根据权利要求 11 所述的装置, 其中, 当在所述第二多个频率分量中未检测到所述 代码时, 所述频域解码器检查第三频域表示的第三多个频率分量, 以确定是否检测到所述 代码, 所述第三多个频率分量相对于所述第一多个频率分量偏移了不同于所述第一偏移的 权 利 要 求 书 CN 102237092 A CN 102237097 A2/2 页 3 第二偏移, 所述第二偏移对应于第二。

8、采样频率失配。 13. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于从 偏移列表中选择所述第一偏移。 14. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于当 在所述第二多个频率分量中检测到所述代码时, 将所述第一偏移添加至偏移列表。 15. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于基 于所述第一偏移来选择将采样音频信号变换成所述第二频率表示所使用的参数。 16. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于选 择要与所述第一多个频率分量中的对应频率分量相邻。

9、的所述第二多个频率分量。 17. 根据权利要求 11 所述的装置, 所述装置还包括偏移补偿器, 该偏移补偿器用于配 置所述第二多个频率分量中的第一频率分量, 以具有比所述第一多个频率分量中的第一频 率分量更窄的带宽。 18. 一种存储机器可读指令的有形制造品, 该机器可读指令在被执行时, 使得机器 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及 当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多。

10、个频 率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分 量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 19. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器将所采样的音频信号变换成所述第二偏移表示。 20. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器选择所述第二多个频率分量中的、 要与所述第一多个频率分量中的对应频率分量相邻 的各频率分量。 21. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器选择所述第二多个频率分量。

11、中的第一频率分量, 以具有比所述第一多个频率分量中的 第一频率分量更窄的带宽。 22. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器调节与所述音频信号的采样相关联的频率, 以选择所述第二多个频率分量。 23. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器基于所述第一偏移来选择将采样音频信号变换成所述第二频域表示所使用的参数。 24. 根据权利要求 18 所述的有形制造品, 其中, 所述机器可读指令在被执行时, 使所述 机器从偏移列表中选择所述第一偏移。 25. 根据权利要求 18 所述的有形制造品, 其。

12、中, 所述机器可读指令在被执行时, 使所述 机器当在所述第二多个频率分量中检测到所述代码时将所述第一偏移添加至偏移列表。 权 利 要 求 书 CN 102237092 A CN 102237097 A1/10 页 4 用于执行音频水印解码的方法、 装置以及制造品 技术领域 0001 本公开总体上涉及媒体监测, 并且更具体地说, 涉及用于执行音频水印解码的方 法、 装置以及制造品。 背景技术 0002 标识媒体内容 ( 例如, 电视 (TV) 节目、 无线电节目、 广告、 评论、 音频 / 视频内容、 电影、 商业广告节目、 广告等 ) 有用于评价对这种内容的视听者接触率 (exposure)。。

13、例如, 在视听者计量应用中, 可以将代码或水印插入或嵌入媒体内容的音频或视频 ( 例如, 节目 或广告 ) 中, 其中, 随后在呈现 ( 例如, 在受监测家庭播放 ) 该媒体内容时在一个或更多个 监测点处检测代码 / 水印。嵌入到原始信号中的代码 / 水印的信息净荷可以包括独特节目 标识、 源标识、 广播方信息, 以及 / 或广播时间。监测点可以包括诸如家庭、 商店、 营业地点 以及 / 或任何其它公共和 / 或私人机构的场所, 其中, 监测媒体内容接触率和 / 或媒体内容 消费量。例如, 在监测点, 捕获来自音频和 / 或视频的代码 / 水印。可以将所收集的代码 / 水印发送给中心数据收集机。

14、构, 以对诸如内容消费统计的计算进行分析。 发明内容 0003 本发明提供一种用于执行音频水印解码的方法、 装置以及制造品。 0004 本发明提供的方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个 频率分量嵌入的听者测量代码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第 一频域表示 ; 确定是否能够在所述第一频域表示的所述第一多个频率分量中检测到所述代 码 ; 以及当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域表示的第二多 个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所述第一多个频 率分量偏移了第一偏移, 所述第一偏移对应于采。

15、样频率失配。 0005 本发明提供的装置包括 : 音频信号的音频输入接口, 该音频信号包括使用第一多 个频率分量嵌入的听者测量代码 ; 采样器, 该采样器用于对所述音频信号进行采样 ; 时域 频域转换器, 该时域频域转换器用于将所采样的音频信号变换成第一频域表示 ; 以及频域 解码器, 该频域解码器用于确定是否能够在所述第一频域表示的所述第一多个频率分量中 检测到所述代码, 并且当在所述第一多个频率分量中未检测到所述代码时, 检查第二频域 表示的第二多个频率分量, 以确定是否检测到所述代码, 所述第二多个频率分量相对于所 述第一多个频率分量偏移了第一偏移, 所述第一偏移对应于采样频率失配。 0。

16、006 本发明提供了一种存储机器可读指令的有形制造品, 该机器可读指令在被执行 时, 使得机器 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入的听者测量代 码 ; 对所述音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是否能够 在所述第一频域表示的所述第一多个频率分量中检测到所述代码 ; 以及当在所述第一多个 频率分量中未检测到所述代码时, 检查第二频域表示的第二多个频率分量, 以确定是否检 测到所述代码, 所述第二多个频率分量相对于所述第一多个频率分量偏移了第一偏移, 所 说 明 书 CN 102237092 A CN 102237097 A2/10 页 5 。

17、述第一偏移对应于采样频率失配。 附图说明 0007 图 1 是采用嵌入到复合电视信号的音频部分中的识别码的示例性广播视听者测 量系统的示意图。 0008 图 2 例示了实现图 1 的示例性编码器的示例性方式。 0009 图 3 例示了实现图 1 的示例性解码器的示例性方式。 0010 图 4 和 5 例示了可以例如通过处理器来执行的、 用于实现图 1 和图 3 的示例性解 码器的示例性处理。 0011 图 6A 和 6B 例示了可以通过图 3 的示例性解码器进行补偿的示例性频率偏移。 0012 图 7 是可以用于和 / 或编程为实现图 4 和图 5 的、 用于实现对图 1 和图 3 的示例 性。

18、解码器和 / 或示例性偏移补偿器的示例性处理的示例性处理器平台的示意图。 具体实施方式 0013 公开了用于执行音频水印解码的示例性方法、 装置以及制造品。所公开的示例性 方法包括以下步骤 : 接收音频信号, 该音频信号包括使用第一多个频率分量嵌入其中的听 者测量代码 ; 对该音频信号进行采样 ; 将所采样的音频信号变换成第一频域表示 ; 确定是 否能够在该第一频域表示的第一多个频率分量中检测到该代码 ; 以及当在第一多个频率分 量中未检测到该代码时, 检查第二频域表示的第二多个频率分量, 以确定是否检测到该代 码, 该第二多个频率分量相对于第一多个频率分量偏移了第一偏移, 该第一偏移对应于采。

19、 样频率失配。 0014 所公开的示例性装置包括 : 对音频信号的音频输入接口, 该音频信号包括使用第 一多个频率分量嵌入其中的听者测量代码 ; 采样器, 该采样器用于对音频信号进行采样 ; 时域频域转换器, 该时域频域转换器用于将所采样的音频信变换成第一频域表示 ; 以及频 域解码器。 该频域解码器用于确定是否能够在该第一频域表示的第一多个频率分量中检测 到该代码 ; 并且当在第一多个频率分量中未检测到该代码时, 检查第二频域表示的第二多 个频率分量, 以确定是否检测到该代码, 该第二多个频率分量相对于第一多个频率分量偏 移了第一偏移, 该第一偏移对应于采样频率失配。 0015 下列描述分别。

20、提及音频编码和解码, 该音频编码和解码还被称为音频水印印制和 水印检测。 应注意到, 关于这点, 音频是具有落入正常人类声频谱内的频率的任何类型的信 号。例如, 音频可以是语音、 音乐、 音频和 / 或视频节目 ( 例如, 电视 (TV) 节目、 电影、 因特 网视频、 无线电节目、 插播商业广告等 ) 的音频部分、 噪音, 或任何其它声音。 0016 一般来说, 对音频进行编码指将一个或更多个代码插入该音频中。 在一些示例中, 该代码被心理声学地掩盖, 以使得该代码对于音频的人类听者来说是听不见的。 然而, 可能 存在该代码对于某些人类收听者来说听得见的某些情况。这些代码还可以被称为水印。嵌。

21、 入到音频中的这些代码可以具有任何适当的长度, 并且可以利用用于将信息 ( 例如, 信道 标识符、 站标识符、 广播方标识符、 内容创建者标识符、 内容拥有者标识符、 节目标识符、 时 间戳、 广播标识符等 ) 映射至这些代码的任何适当的技术。而且, 可以将这些代码转换成由 嵌入到音频中的、 具有选定频率的信号所表示的符号。任何适当的进行编码和 / 或纠错的 说 明 书 CN 102237092 A CN 102237097 A3/10 页 6 技术都可以用于将代码转换成符号。这种听者测量代码的一些示例包括 Nielsen 公司 ( 美 国 )、 LLC、 本专利的受让人所有的 Nielsen。

22、 码。Nielsen 码是由 Nielsen 公司 ( 美国 )、 LLC、 Nielsen 公司 ( 美国 ) 的任何分支机构或 LLC 的任何分支机构嵌入到任何媒体内容中的任 何代码, 和 / 或与 Nielsen 公司 ( 美国 )、 LLC 或与 Nielsen 公司 ( 美国 ) 的任何分支机构、 LLC 的任何分支机构相关联地嵌入到任何媒体内容中的任何代码。在于此描述的示例中, 在发送和 / 或广播之前, 和 / 或发送和 / 或广播期间, 将媒体内容编码成包括一个或更多个 这种代码。当在内容呈现设备上呈现 ( 例如, 通过 TV、 无线电、 计算设备、 蜂窝电话、 手持设 备, 。

23、以及/或任何其它适当设备播放)媒体内容时, 处于呈现区域中的人不仅接触该媒体内 容, 而且不为他们所知的是, 还接触了嵌入到该媒体内容中的代码。 0017 虽然参照包括嵌入了和/或编码到其音频部分中的代码的广播音频/视频媒体内 容 ( 例如, TV 节目、 商业广告节目、 电影等 ) 对以下示例进行描述, 但这种示例仅是例示性 的。例如, 代码可以附加地或另选地嵌入和 / 或编码到其它类型的媒体内容, 诸如但不限于 音频内容、 视频内容、 图形内容、 图像、 游戏、 调查 (survey), 以及 / 或网页。而且, 在此描述 的方法和装置可以用于检测嵌入到任何数量和 / 或类型的附加地和 /。

24、 或另选的媒体内容 ( 例如, 无线电广播、 音频通知等 ) 中的代码。而且, 媒体内容不需要广播。例如, 媒体内容 可以经由任何数量和 / 或类型的有形介质 ( 如包括嵌入代码的数字万用盘 (DVD) 和 / 或光 盘 (CD) 来散布。 0018 图 1 示出了示例性编码与解码系统 100。图 1 的示例性系统 100 描绘了示例性电 视观众测量系统, 其将用作进一步描述在此公开的示例性解码处理的情境。图 1 的示例性 系统100包括编码器102, 该编码器102将代码103添加至音频信号104, 来生成编码音频信 号 105。代码 103 可以表示任何期望的或选定的信息。例如, 在媒体监。

25、测背景下, 代码 103 可以表示诸如电视广播、 无线电广播等的广播媒体内容的标识。另外, 代码 103 可以包括指 示将该代码 103 插入到音频中的时间或媒体广播时间的定时信息。 0019 音频信号 104 可以是任何形式的音频, 例如包括话音、 音乐、 噪音、 商业广告音频、 与电视节目、 现场演奏等相关联的音频。在图 1 的示例中, 编码器 102 将编码音频信号 105 传递至发送器 106。该发送器 106 将编码音频信号 105 连同与该编码音频信号 105 相关联 的任何视频信号 108 一起发送。在一些情况下, 虽然编码音频信号 105 可能具有关联的视 频信号 108, 但。

26、编码音频信号 105 不需要具有任何关联的视频。 0020 尽管图 1 所示示例性系统 100 的发送侧示出了单个发送器 106, 但该发送侧可以 更加复杂, 并且可以包括在可以传递音频信号 104 的散布链中的多个级。例如, 该音频信号 104 可以在全国网络级生成并且向局部网络级传递以进行局部散布。因此, 尽管在发送器 106之前的发送队列中示出了编码器102, 但可以在音频信号104的整个散布链放置一个或 更多个编码器。因此, 音频信号 104 可以按多个级来编码并且可以包括与那些多个级相关 联的多个嵌入代码。下面, 结合图 2, 对实现示例性编码器 102 的示例性方式进行描述。 00。

27、21 图1的示例性发送器106可以包括 : 可以通过自由空间传播(例如, 经由陆地或卫 星通信链路 ) 散布编码音频信号的一个或更多个射频 (RF) 发送器, 或者用于通过电缆、 光 纤等散布编码音频信号的发送器。在一些示例中, 发送器 106 用于遍及广的地理区域广播 编码音频信号105。 在其它情况下, 发送器106可以通过有限的地理区域散布编码音频信号 105。 这种发送可以包括将编码音频信号105上变频至射频, 以能够传播编码音频信号105。 说 明 书 CN 102237092 A CN 102237097 A4/10 页 7 另选的是, 该发送可以包括散布采用数字值或数字值包形式的。

28、编码音频信号 105, 该数字值 或数字值包可以通过一个或更多个网络 ( 如因特网、 广域网、 和 / 或局域网 ) 进行发送。因 而, 编码音频信号 105 可以通过载波信号、 通过信息包和 / 或通过任何适当的技术来传送, 以散布音频和 / 或视频信号。 0022 当通过接收器 110( 在媒体监测的情境下, 该接收器 110 可位于统计上选定的计 量点 112 处 ) 接收示例性的编码音频信号 105 时, 对该音频信号 105 进行处理以恢复代码 103, 即使在通过接收器 110 的扬声器 114 呈现编码音频信号 105 时, 收听者觉察不到 ( 或 大致觉察不到 ) 代码 103。

29、 的存在。为此, 解码器 116 直接连接至接收器 110 处可用的音频 输出部 118, 或者连接至放置在再现音频 105 的扬声器 114 附近的麦克风 120。所接收音频 信号 105 可以是单声道格式或者立体声格式。下面, 结合图 3, 对实现图 1 的示例性解码器 116 的示例性方式进行描述。 0023 图 2 例示了实现图 1 的示例性编码器 102 的示例性方式。如上所述, 图 2 的示例 性编码器 102 将一个或更多个听不见 ( 或大致听不见 ) 的代码 103 插入到音频 104 中, 以 创建编码音频 105。在图 2 所示的示例中, 编码器 102 包括采样器 201。

30、, 该采样器 201 用于 按采样频率 202 对音频 104 进行采样, 以形成采样的音频信号 203。将示例性采样器 201 耦 接至掩蔽估算器(masking evaluator)204, 其估算音频104将代码103隐藏在其中的能力。 代码103被提供给代码频率选择器206, 代码频率选择器206确定或选择将代码103插入或 嵌入到采样的音频 203 中所使用的频率。代码频率选择器 206 可以利用任何适当的检测或 校正编码将代码 103 转换成符号。将对指定或选定的代码频率 ( 该代码频率用于呈现代码 103) 的指示 207 传递至掩蔽估算器 204, 以使该掩蔽估算器 204 获。

31、知该频率, 针对该频率应 当确定通过音频 104 对代码 103 的掩蔽。另外, 将对代码频率的指示 207 提供给代码合成 器 208, 该代码合成器 208 生成具有代码频率选择器 206 所指定的频率的正弦波信号 209。 组合器210接收来自代码合成器208的合成的代码频率209和向采样器提供的音频104, 并 将这两者进行组合以生成编码音频 105。 0024 在以模拟形式将音频 104 提供给编码器 102 的一些示例中, 示例性采样器 201 利 用模拟数字转换器或任何其它适当的数字转换器来实现。采样器 201 可以以例如 48000 赫 兹 (Hz) 或适于满足 Nyquist。

32、 标准的任何其它采样率对音频 104 进行采样。例如, 如果将音 频 104 频率上限制在 15000Hz, 则采样器 201 可以以 30000Hz 的采样频率 202 来操作。来自 采样器 201 的各样本 203 可以通过数字比特串来表示, 其中, 比特数表示音频 104 被采样的 精度。例如, 采样器 201 可以生成 8 比特、 16 比特、 24 比特, 或 32 比特值 302。 0025 除了对音频 104 进行采样以外, 图 2 的示例性采样器 201 将要一起处理的许多样 本 ( 即, 音频块 ) 进行累积。例如, 示例性采样器 201 一次可以累积向掩蔽估算器 204 传。

33、递 的 512 个样本音频块。另选的是, 掩蔽估算器 204 可以包括累加器, 在该累加器中, 在音频 块被处理之前将它们累积在缓冲区中。 0026 图2的示例性掩蔽估算器204接收或累积这些样本(即, 512个样本), 并确定所累 积的样本的向人类听力大致隐藏代码频率的能力。即, 掩蔽估算器 204 例如通过整体估算 音频 104 的各临界频带以确定其能量, 并确定各临界频带的类似噪声或类似音调的属性以 及确定这些临界频带掩蔽代码频率的总体能力, 来确定这些代码频率是否可以隐藏在由所 累积的样本表示的音频 104 内。临界频带 ( 其可以通过对人类听知觉执行的实验研究来确 说 明 书 CN 。

34、102237092 A CN 102237097 A5/10 页 8 定 ) 在宽度上可以从频谱低端处的窄频带至声频谱高端处更宽频带进行改变。如果掩蔽估 算器 204 确定可以将代码频率隐藏在音频 104 中, 则掩蔽估算器 204 指示可以将代码频率 插入到音频 104 内的振幅等级, 同时仍保持大致隐藏, 并向代码合成器 208 提供振幅信息。 0027 在一些示例中, 代码频率选择器 206 利用将输入代码 103 与状态相联系的查寻表 来实现, 在该查寻表中, 各状态表示要在编码音频信号 105 中强调的许多代码频率。换句话 说, 可以根据代码频率映射表将输入代码 103 映射至代码频。

35、率。代码频率选择器 206 可以 包括将符号或数据状态与冗余地表示数据状态的代码频率集相联系的信息。 选定的供使用 的状态的数目可以基于输入代码 103 的类型。例如, 可以将包含两个比特的输入代码 103 转换成表示四个符号或状态 ( 例如, 22) 中的一个的代码频率。在其它示例中, 包含四比特 信息的输入代码 103 由 16 个符号或状态 ( 例如, 24) 中的一个表示。在将代码 103 转换成 一个或更多个符号或状态时, 可以附加地或另选地使用一些其它编码来加入纠错。 另外, 在 一些示例中, 可以将一个以上代码 103 嵌入到音频 104 中。 0028 当经由采样块的傅里叶变换。

36、而在频域中表示音频信号 104 时, 利用代码频率映射 表选定的频率指数对应于要嵌入到音频信号 104 中的正弦波频率。参考频率指数而不是实 际频率, 这是因为这些指数所对应的频率基于编码器 102 内使用的采样率 202 和由解码器 116 处理的采样数而变。与相邻指数对应的相邻频率之间的间隔与采样频率 202 和音频块 尺寸的比率成比例。例如, 以 48000Hz 的采样率和 18432 个样本的音频块尺寸, 相邻指数之 间的间距约为 2.6Hz。因而, 频率指数 360 对应于 936Hz(2.6Hz360)。当然, 可以选择其 它采样率和块尺寸, 由此可以选择其它频率间隔。 而且, 不。

37、是所有频率指数都需要用于例如 避免与用于传送其它代码和 / 或水印的频率的干扰。而且, 所选定和 / 或使用的频率范围 不需要连续。在一些示例中, 使用 0.8kHz 至 1.03kHz 与 2.9kHz 至 4.6kHz 范围内的频率。 在其它示例中, 使用 0.75kHz 至 1.03kHz 与 2.9kHz 至 4.4kHz 范围内的频率。 0029 图 2 的示例性代码合成器 208 从代码频率选择器 206 接收对要包括频率指数的指 示 207, 以创建包括对输入代码 103 的表示的编码音频信号 105。响应于对频率指数的指示 207, 代码合成器208生成具有所识别的频率的许多正。

38、弦波(或包括多个正弦波的一个复合 信号 )。这种合成可以导致正弦波信号或者导致表示正弦波信号的数字数据。在一些示例 中, 代码合成器 208 生成具有由掩蔽估算器 204 所指示的振幅的代码频率。在其它示例中, 代码合成器 208 生成具有固定振幅的代码频率, 并且那些振幅可以通过在代码合成器 208 内实现的或者设置在代码合成器 208 与组合器 210 之间的一个或更多个增益块 ( 未示出 ) 来调节。 0030 虽然前面描述了生成正弦波或表示正弦波的数据的示例性代码合成器 208, 但代 码合成器的其它示例性实现也是可以的。例如, 另一示例性代码合成器 208 不是生成正弦 波, 而是可。

39、以输出频域系数, 该频域系数用于调节提供给组合器 210 的特定音频频率的振 幅。以这种方式, 可以将音频 104 的频谱调节成包括必要的正弦波。 0031 图 2 的示例性组合器 210 接收代码合成器 208 的输出 209 和音频 104 两者, 并将 它们进行组合以形成编码音频 105。组合器 210 可以以模拟或数字形式来组合代码合成器 208 的输出 209 和音频 104。如果组合器 210 执行数字组合, 则代码合成器 208 的输出 209 可以与采样器 201 的输出相组合, 而不是与输入至采样器 201 的模拟音频 104 相组合。例 如, 数字形式的音频块可以与数字形式。

40、的正弦波相组合。另选的是, 该组合可以在频域执 说 明 书 CN 102237092 A CN 102237097 A6/10 页 9 行, 其中, 音频 104 的频率系数根据表示正弦波的频率系数来调节。作为另一另选例, 可以 以模拟形式组合正弦波和音频 104。编码音频 105 可以以模拟或数字形式从组合器 210 输 出。如果组合器 210 的输出 105 是数字的, 则可以在将其耦接至发送器 106 之前随后将其 转换成模拟形式。 0032 在 2008 年 10 月 10 日提交的美国专利申请 No.12/249619、 2009 年 8 月 31 日提交 的美国专利申请 No.12。

41、/551220, 以及 2009 年 5 月 12 日提交的美国专利申请 No.12/464811 中描述了可以用于选择代码频率、 通过音频104分析对嵌入代码的掩蔽, 以及/或实现代码 频率映射表的示例性方法、 装置以及制造品、 示例性采样器 201、 示例性掩蔽估算器 204、 示 例性代码频率选择器 206、 示例性代码合成器 208、 示例性组合器 210 和 / 或示例性编码器 102, 通过引用将各专利申请的全部内容合并入于此。 0033 图 3 例示了实现图 1 的实例解码器 116 的示例性方式。图 3 的实例解码器 116 对 插入到音频 104 中的代码 103 进行检测、。

42、 解码以及 / 或提取, 以在编码器 102 处形成编码音 频 105。如图 1 所示, 编码音频 105 可以经由有线和 / 或无线连接提供至接收器 110。而在 下列描述中, 为了容易理解而假定解码器 116 基本上处理由编码器 102 形成的同一编码音 频 105, 一般来说, 由解码器 116 处理的音频例如由于发送器 106、 接收器 110 以及 / 或任何 介入的传输媒体所引入的失真、 噪声等而不同。因此, 实际上, 这种影响通过执行任何数量 和 / 或类型的适当的噪声缩减、 失真减轻以及 / 或纠错技术来进行控制。 0034 图3的示例性解码器116包括采样器302, 以模拟形。

43、式向该采样器302提供编码音 频 105, 该采样器 302 可以利用模拟数字转换器或任何其它适当的技术来实现。图 3 的示 例性采样器 302 例如以 48000Hz 的标称采样频率 303 对编码音频 105 进行采样。当然, 可 以有利地选择更低的采样频率, 以便在解码时降低计算负荷。然而应当将采样频率 303 选 择成满足 Nyqusit 标准。而且, 如下所述, 可以将采样频率 303 调节和 / 或选择成对采样频 率 202( 图 2)、 接收器 110 中采用的用于经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进。

44、行补偿。这种采样频率失配和 / 或 差异可以导致嵌入的代码 103 在解码器 116 中以错误的代码频率出现, 并由此可以削弱解 码器 116 正确地解码、 检测以及 / 或提取代码 103 的能力。采样频率失配可能例如因在接 收器 114 和 / 或解码器 116 中使用低成本晶体和 / 或因导致谐振频率漂移的晶体老化而造 成。低成本晶体通常在消费级装置 ( 如个人计算机 (PC) 或机顶盒中发现, 其中, 从理想中 心频率的轻微漂移对人耳不易察觉, 但可能影响对嵌入的代码的检测、 解码和 /或提取。通 常, 编码器 102 利用准确的时基和 / 或晶体来实现。 0035 将来自示例性采样器。

45、 302 的样本提供给时域频域转换器 304。图 3 的示例性时域 频域转换器304利用离散的傅里叶变换(DFT)或用于将基于时间的信息转换成基于频率的 信息 305 的任何其它适当的技术来实现。在一些示例中, 该时域频域转换器 304 可以利用 滑动DFT来实现, 其中, 每当将新样本提供给示例性时域频域转换器304并且丢弃旧样本时 就计算频域表示或频谱305。 在一些示例中, 时域频域转换器304对接收的编码音频105的 具有 18432 个样本的块, 标称地计算频域表示 305。时域频域转换器 304 生成的频域表示 305 的分辨率随着为生成频域表示 305 而使用的样本数而增加。 0。

46、036 正常地选择采样频率303和由时域频域转换器304处理的样本数, 以与编码器102 中为选择频率指数而使用的分辨率相匹配。然而, 如下所述, 由时域频域转换器 304 处理 说 明 书 CN 102237092 A CN 102237097 A7/10 页 10 的、 用于计算频域表述 305 的样本的数目可以被调节和 / 或选择成对采样频率 202( 图 2)、 接收器 110 中采用的经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进行补偿。 0037 由时域频域解码器304生成的频域表示305传递至频域解码器306,。

47、 该频域解码器 306监测与频率指数相对应的、 可以潜在地传送由示例性编码器102插入的代码103的所有 频率或谱线。示例性频域解码器 306 在接收到的音频 105 中寻找强调的代码频率的图案。 如下所述, 可以另外或另选地监测不同频率集和/或偏移频率集, 以对采样频率202(图2)、 接收器 110 中采用的用于经由扬声器 114 输出编码音频 105 的采样频率、 和 / 或采样频率 303 中的任一个或全部之间的任何失配进行补偿。一旦频域解码器 306 已经确定强调了哪 些代码频率, 频域解码器 306 就基于所强调的代码频率来确定存在于编码音频 105 内的符 号。频域解码器 306。

48、 可以记录这些符号, 以及 / 或可以将那些符号解码成嵌入和 / 或插入 到音频 105 中的代码 103。将是否由频域解码器 306 检测、 解码以及 / 或提取出有效代码 103 的指示 307 提供给偏移补偿器 308。 0038 在 2008 年 10 月 10 日提交的美国专利申请 No.12/249619、 2009 年 8 月 31 日提交 的美国专利申请 No.12/551220, 以及 2009 年 5 月 12 日提交的美国专利申请 No.12/464811 中描述了可以用于实现图3的示例性采样器302、 示例性时域频域转换器304以及/或示例 性频域解码器 306 的示例。

49、性方法、 装置以及制造品。虽然这些示例可能未描述从示例性偏 移补偿器 308 接收的可调和 / 或可选输入, 但代替的是, 这些示例可以根据预先选定和 / 或 预先确定的参数来实现, 本领域普通技术人员容易明白, 怎样修改这些示例, 以适应来自偏 移补偿器 308 的可调和 / 或可选输入。 0039 为了补偿频率偏移, 图 3 的示例性解码器 116 包括示例性偏移补偿器 308。当图 3 的示例性偏移补偿器 308 未接收到频域解码器 306 能够从编码音频 105 检测、 解码以及 / 或提取出代码的指示时, 该示例性偏移补偿器 308 调节以下各项中的一个或更多个 : 采样 频率 303、 时域频域转换器 304 所使用的块尺寸以及 / 或由频域解码器 306 所考虑、 检查以 及 / 或分析的代码频率。 0040 在一些示例中, 偏移补偿器308保持使得能够对代码103进行正确检测、 解码以及 / 或提取的先前频率偏移列表 310。当偏移使能适当地解码代码 103 时, 示例性偏移补偿器 308 将该偏移存储在列表 310 中。列表 310 可以包括是否调节和 / 或选择了采样率 303、 块 尺寸。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 乐器;声学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1