处理数字数据 【发明背景】
【技术领域】
本发明涉及:处理数字数据的方法;处理数字数据的设备;处理数字数据的计算机程序;数据格式;恢复处理过的数据的方法及设备;以及相应的程序。本发明的某些方面和实施例涉及处理音频信号,但是要理解到,在其它方面和实施例中,本发明可适用于其它数据。其它数据可以是其它示例中的音频/可视数据、视频数据、图象数据、计算机程序以及多媒体数据。
背景技术
EP-A-1189372(Matsushita)公开了许多用于防止音频信号被误用的技术。在一种技术中,音频在分发给用户之前被压缩和加密。用户需要解密密钥来访问音频。用户可以购买密钥以访问音频。用户只有购买了密钥,他们才能对音频进行抽样。其它技术把可听水印嵌入音频信号中以对其进行保护。在一种技术中,音频信号根据预定规则与可听信号(又称作水印)结合。水印降低音频信号的质量。组合经过压缩传送给播放器。播放器可对降级的音频信号解压缩并再现,允许用户确定他们是否希望购买允许其删除水印的“密钥”。水印通过对解压的降级音频信号添加相等且相反的可听信号来删除。水印可以是降低音频质量的任何信号。水印可以是噪声。水印可以是例如“这段音乐用于抽样回放”等通知。
2002年2月6日提交的共同未决的英国专利申请020737.3(索尼英国有限公司)公开了一种将水印应用到视频以修改压缩视频位流的方法。位流包含表示压缩视频的数字代码。至少选择一个数字代码。代码占用要包含至少一个水印代码的位流地一部分,该水印代码表示在信息信号中可感觉到的水印。从位流的所述部分删除所选数字代码。水印代码被放入位流的所述部分取代所选代码。从位流的所述部分删除的所选代码的位数大于或等于放入所述部分的所述水印代码的位数。删除的所选代码经加密并附加到位流的尾部和/或放入在位流中创建的水印用户数据字段。
WO02/51150公开了一种音频信号在视频信号的消隐周期中传送的系统。压缩视频信息和压缩音频信息从DVD再现。视频由计算机解码。计算机对解码视频加密。计算机还对压缩音频加密。计算机经由电缆输出加密视频和加密音频。
US-A-6041160在复用器中把编码音频信息与至少已经部分加扰的压缩视频进行组合。
US-A1-2002/0108043产生包含音频和视频信息的MPEG编码数据。开关有两个输入:一个连接成直接接收MPEG编码数据,以及另一个经由加密装置进行接收。开关选择一个或另一个输入以生成部分加密的MPEG数据。
US-A-4266243包括把合成的视频信号与加扰并压缩的音频信号进行组合的混频器。音频信号在加扰装置中被加扰,并且然后,加扰音频在应用于混频器之前在压缩器中被压缩。
GB-A-2369022(Radioscape有限公司)描述了音频文件通过数字无线电的传送。
压缩形式中的不完整和/或部分损坏的音频文件,通过数字无线电以“一般文字形式(in the clear)”(即未加密)作为第一数据流被传送。通过删除n-m个帧、保留m个帧被传送,使n个帧的音频文件不完整。通过损坏那些帧中的m-p个帧保留p个未损坏的帧以“一般文字形式”被传送,破坏该文件。
称作“δ流”的第二数据流包含n-m个删除的帧以及m-p个原始(未损坏)帧,总共n-p个帧。那些n-p个帧被加密。在一个实例中,那些n-p个加密帧被嵌入在音频帧本身中分配的额外空间内。
通过把从第二数据流删除的n-m个帧重新插入第一数据流,并用取自第二数据流中的m-p个原始帧替换第一数据流中的m-p个损坏帧,接收器能够重组原始音频文件。
【发明内容】
根据本发明的第一方面,提供一种处理数字音频信号的方法,包括以下步骤:
a)提供表示未受损音频信息的数字音频信号;
b)对所述数字音频信号进行压缩和加密,以产生第一压缩并加密的音频信号,其中音频信号的音频信息与所述数字音频信号的音频信息相比基本上没有受损;
c)产生未加密的第二音频信号;以及
d)组合所述第一和第二音频信号以产生组合信号,该组合信号包含所述压缩并加密的第一音频信号和未加密的第二音频信号。
数字音频信号最好经过无损压缩,但也可通过“有损”过程来压缩。因此,第一压缩并加密的音频信号最好是因无损压缩的数字音频信号的未受损表示,但在有损压缩已经导致某些数据的丢失的程度时,也可以是基本未受损的表示。
由于第一音频信号(基本)未受损,因此它是可以仅通过将它与第二音频信号分离并对它进行解密来恢复的,这是一种比较简单的过程。它不要求利用来自另一个信号的数据进行重组(c.f.Radioscape),那是一个比较复杂的过程。
由于第一音频信号被加密,因此没有未经授权使用的危险。
第二信号未加密,因此可以容易地再现。
第一音频信号最好经过压缩然后再加密。最好的是,用于加密第一音频信号的加密算法没有明显地增加第一音频信号的位数。位数的少量增加是可以接受的。
压缩减少了数据量,并且加密把压缩数据转换成噪声。第一信号然后对于用户表现为组合信号中的噪声。
第二信号可以是(未加密且未压缩的)数字音频信号或另一音频信号的受损型式。
在第二信号是原始数字音频信号的受损型式的情况下,用户可收听(未加密的)第二信号以确定他们是否希望访问该原始数字音频信号。如果他们希望访问该原始数字音频信号,则那个信号可从压缩并加密的第一信号中再现。原始数字音频信号保持没有误用的危险,因为没有解密密钥用户不能访问它,而受损的第二信号在没有解密的情况下用户也能使用。
第二信号可以是第一信号的受损并压缩的型式,在这种情况下,用户需要适当的解压器来访问受损信号。
本发明的第二方面,在包括事务处理服务器以及至少第一和第二客户机的系统中,提供一种从第一客户机向第二客户机传送表示内容的数字信号的方法,该方法包括以下步骤:
采用第一客户机来实现本发明的所述第一方面的方法,以产生组合信号,并将标识符与组合信号相关联用于标识该组合信号;
向事务处理服务器提供标识符以及至少一个密钥,用于对加密信号进行解密,并在事务处理服务器中存储所述标识符和所述至少一个密钥;
将组合信号传送给第二客户机;
得出与组合信号相关的所述标识符;
把标识符从第二客户机传送给事务处理服务器;
在满足预定条件的情况下,从事务处理服务器向第二客户机传送与所述标识符相关的至少一个密钥,用于对加密的第一信号解密;以及
采用第二客户机将第一信号与第二信号分离,并恢复第一信号。
根据第三方面,在包括至少第一和第二处理器的系统中提供一种从第一处理器向第二处理器传送表示内容的数字信号的方法,该方法包括以下步骤:
采用第一处理器来实现本发明的所述第一方面的方法,以产生组合信号,并将标识符与组合信号相关联用于标识该组合信号;
存储所述标识符;
将组合信号传送给第二处理器;
在所述第二处理器,得出与组合信号相关的所述标识符;
在满足预定条件的情况下,向第二处理器传送与所述标识符相关的至少一个密钥,用于对加密的第一信号解密;以及
采用第二处理器将第一信号与第二信号分离,并再现第一信号。
本发明的第四方面提供一种处理数字信号的方法,包括以下步骤:
提供表示第一信息的第一数字信号,
提供第二数字信号,以及
通过用第一信号的位替换第二信号的最低有效位(LSB),并保持第二信号的最高有效位(MSB),将第一信号嵌入第二信号中,
从而,第一信号作为噪声出现在第二信号中。
在第四方面,第一信号最好是压缩信号和/或加密信号。
本发明的第五方面提供一种处理数字信号的方法,包括以下步骤:
提供表示基本未受损的第一信息的第一数字信号,该第一信号为压缩和/或加密信号,
提供表示第二信息的未加密第二数字信号,并且它按照具有辅助数据空间的压缩格式进行压缩,以及
将包含所述基本未受损第一信息的第一信号与第二信号相组合,嵌入至少一部分在第二信号的所述辅助数据空间中所嵌入的第一信号。
在第五方面,第一信号的一部分可附加到第二信号。
第六方面提供一种处理数字信号的方法,包括以下步骤:
提供表示第一信息的第一数字信号,
提供第二数字信号,以及
通过选取N个抽样的分组并在对应于第一信号的M位集合的各组的N个抽样上进行分布,将第一信号嵌入第二信号中,其中比率M/N为整分数。
在第四、第五和第六方面,第一信号最好表示计算机程序,并且第二信号最好表示音频信号。因此,在第四、第五和第六方面的实例中,计算机程序可与音乐轨道组合,该组合记录在记录媒体例如压缩光盘上。
在需要关注的权利要求书中阐述本发明的这些及其它方面。权利要求书的特征可结合在除权利要求书中明确阐述的那些之外的组合之中。
【附图说明】
为了更好地了解本发明,下面将通过实例,参照附图来进行说明,附图包括:
图1是根据本发明、用于处理的音频信号的第一说明性系统的示意框图;
图2是根据本发明、用于处理的音频信号的第二说明性系统的示意框图;
图3是根据本发明、用于处理的音频信号的第三说明性系统的示意框图;
图4是根据本发明、用于处理的音频信号的第四说明性系统的示意框图;
图5是根据本发明、用于处理的音频信号的第五说明性系统的示意框图;
图6是根据本发明、用于处理的音频信号的第六说明性系统的示意框图;
图7是根据本发明、用于处理的音频信号的第七说明性系统的示意框图;
图8是根据本发明、用于处理的音频信号的第八说明性系统的示意框图;
图9至14是根据本发明的说明性数据结构;
图15是根据本发明的音频信号播放器的说明框图;
图16是流程图,说明图15的播放器的操作;
图17是可利用本发明的联网系统的示意图;
图18是流程图,说明在音频信号的抽样之间分布音频信号位的方法;以及
图19是反转图18的过程的方法的流程图。
附图中,相同的部件由相同的标号表示。
下面通过实例、根据音频信号来描述本发明。
音频文件的压缩及加密
参照图1,提供原始数字音频的源1。本例中的音频为文件形式。数字音频是以任何适当格式例如PCM、WAV、AIFF(音频交换文件格式)的未压缩的数字音频。数字音频可以是定点格式或者浮点格式。以下描述假设定点格式,但下面某个部分说明浮点格式。源可以是任何适当的源,并且在本例中可以是计算机。原始数字音频由压缩器2进行压缩,压缩器2执行标准无损压缩算法以产生压缩音频文件。将理解到,也可使用其它压缩算法。由压缩器2实现的压缩取决于音频的内容。压缩音频由加密器4加密,该加密器4执行不会明显增加压缩音频文件的大小的标准加密算法,以产生无损压缩并加密的音频文件。位数的少量增加是可接受的。这种增加可能是由于例如提供循环冗余码信息造成的。Rijndael是这种加密算法的一个实例:也可使用其它算法。加密算法使用至少一个密钥。对文件解密所需的密钥或多个密钥被安全地存储在存储器3中,用于稍后对音频解密。
将第一压缩并加密的音频信号与第二音频信号组合
在图1的实例中,压缩并加密的音频的第一信号在组合器8中与来自源6的第二音频信号进行组合。对来自源1的第一信号的加密,创建了一种因加密的随机效果而在组合信号中对于人耳表现为噪声的信号。来自源6的第二信号为任何音频信号。一个实例是通知。通知的一个实例让用户了解来自源1的原始音频是什么,以及他们如何获得用于对原始音频解密的密钥或多个密钥。在下面更详细描述的其它实例中,第二信号是原始音频的受损型式。在本例中,第二音频信号可以至少在没有解密、并且最好是没有解压缩的情况下、甚至在与来自源1的第一信号组合时以可理解方式再现。
在本例中作为文件的组合信号,则存储在存储器9中,和/或提供给传送系统9,和/或记录在图9中的表示为分发材料的适当记录媒体9中。传送系统可以是例如因特网之类的“下拉”系统或者例如包括DAB(数字音频广播)和DVB(数字视频广播)的任何广播系统之类的“下推”系统。
好像压缩器2、加密器4及组合器8是分立的硬件元件一样,描述了图1的实例。尽管它们可以是这样的,但图1的系统也可通过运行在计算机上的软件来实现。
图2与图1的不同之处在于,表示了第二信号的源6的一个实例的详细情况。在本例中,源6向组合器8提供来自源1的原始音频的受损型式。本例中的受损音频当与原始音频组合时在没有解密及解压的情况下是可再现的,其在组合信号中表现为噪声。这允许用户在不允许他们访问原始未受损音频的情况下收听作为原始音频的受损型式的试听信号。
将破坏者信号与音频信号混合
如图2所示,源6最好包括混频器12,它将来自源1的原始音频与来自源11的破坏者信号混合,以产生试听信号。混频器为加性混频器,并且混频器的输出为试听信号。试听信号中的原始音频和破坏者信号的相对幅度是判断的问题。如果破坏者信号的电平相对原始音频过小,则可能促使未经授权的删除尝试。如果其电平过高,则会过多地掩盖原始音频。试听信号在组合器8中与压缩并加密的原始音频组合,以产生分发材料9。破坏者信号可以是任何信号。破坏者信号的一个实例是如上所述的通知。破坏者信号的源11可存储一组可根据待破坏的音频选取的不同的信号。
调制破坏者信号
图3示出了对图2的系统的修改,其中提供了调制器14。调制器14对破坏者信号进行调制,以使它更难以删除。调制可以是包括例如混响、相位调制及音调变换的任何适当的调制。
图1至3示出一些系统,这些系统允许可作为原始信号的受损型式的来自源6的第二信号再现,而不需要解压缩及解密。因此,在第二信号为来自源1的原始音频的受损型式的情况下,试听信号具有与原始音频相同的格式(虽然经过破坏),并且可采用能够再现来自源1的原始信号的任何播放器再现。
压缩试听信号
图4、5和6示出了图2的系统的修改的系统。它们与图2的不同之处在于,增加了图4中的压缩器16以及图5和图6中的压缩器18。压缩器16或18压缩试听信号的MSB。LSB在压缩之前被删除,因为它们由第一压缩并加密的音频信号取代,如以下所述。包括调制器14的图3的系统可按照图4、5和6所示的方式进行修改。在图4中,压缩器16根据无损压缩算法进行操作,并且可以与压缩器2相同。在图5和图6中,压缩器18根据有损压缩算法进行操作,其实例为在MPEG标准中定义的压缩算法。为了再现试听信号,再现设备需要与压缩器16或18对应的解压缩器。
将压缩并加密的音频信号与试听信号组合
图1至5中的任一个的组合器8可按照以下方式操作。
假定压缩并加密的音频信号为文件形式,并且试听信号也为文件形式。还假定两个文件具有相同格式,但这不是必需的。参照图10,每个文件都包含抽样音频,该抽样音频具有由含最高有效位(MSB)和最低有效位(LSB)的数位表示的抽样。每个文件具有标题,它可以例如至少标识文件类型(如WAV)以及文件中的抽样数。每个抽样的位数可以是本领域中惯用的任何数,例如8、16、24或32。以下描述的图11假定每个抽样P1、P2...Pn为16位。
A)在一个实例中,试听文件的抽样的LSB由压缩并加密的音频信号的抽样取代。因此,在组合信号中,MSB表示试听文件,而LSB是表示来自源1的原始音频的噪声,并作为噪声出现在组合信号中。
如果试听文件足够长,则所有加密并压缩的音频的抽样放置在试听文件的LSB中。如果加密并压缩的音频文件没有填满试听文件的LSB,则试听文件的未用的LSB可由零取代或者它们可保持不变。如果加密并压缩的文件比试听文件的LSB可容纳的要长,则创建组合文件的附加抽样,包括是加密并压缩的音频的抽样的零填充MSB和LSB。
在组合信号文件的每个抽样中的MSB对LSB的比率可以是固定的,或者它可以是可变的。参照图11,至少当比率是可变时,并且最好是还当比率是固定时,在组合文件中提供数据h,表示MSB与LSB之间的边界。对于固定比率,数据h可在文件中在文件头提供一次。它被加到由LSB表示的加密数据中,如图11所示。如果比率是可变的,则在比率发生变化的每个位置提供数据h。
MSB对LSB的比率可选择为试听信号的文件长度与压缩并加密的音频信号的文件长度的函数。
位分布
B)参照图18,在试听信号的抽样上分布压缩并加密的信号的位的另一种方法(在本文中称作“位分布”)如下所述。
此说明假定音频文件如图2所示进行处理。原始音频具有n位抽样,它们由压缩器2压缩,并由加密器4根据没有明显改变压缩位数的加密算法进行加密。例如,假定10秒立体声音频以48kHz抽样,具有16位抽样和0.65的压缩比率。试听抽样的数量则为48000*2*10=960000。压缩位数为0.65*16*960000*16=9,984,000。
在步骤S50,计算压缩位数对未压缩试听抽样的数量之比。对于本例,该比率为10.4。
在步骤S51,那个比率被转换为等于或大于所述比率的简单的整分数M/N,其中M和N为低整数(low integer)。10.4=52/5。因此,M=52个位将在每组N=5个抽样上分布,作为那些试听抽样的LSB。(实际上,希望选择小于在其上实现本方法的计算机的字长的M的值,以便保持后续处理简单。存储M和N(S511),以能实现过程的后续逆转。
在步骤S52,计算值S=2R。R等于M/N。
在步骤S53,得到N=5个抽样且M=52个位的分组。标题数据被加到位流以指示分组。为了便于以下说明,假定M个位表示值V的M位数。这些抽样通常编号为0至N-1,在本例中为0、1、2、3和4。
在步骤S54,设X=N-1。
在步骤S55,对N个抽样的每个计算A’[X]=((A*(F-S)/F)/S)*S,其中A为试听抽样的范围。这换算A的值,并且以下称作换算值。
作为说明,步骤S55为当组合时产生步骤S55的两个子步骤的组合。在第一子步骤中,每个音频抽样根据A’[X]=A[X]*((F-S)/F)预先换算,因此它适合范围-(F+S)...(F-S)。F为抽样可取的最大值。对于16位抽样,F=+/-215-1。第二子步骤根据A”[X]=(A’[X]/S)*S换算每个预先换算的音频抽样A’[X],以便它具有集合{-(F+S),-2S,-1S,0,1S,2S..F-S}中的值。
在步骤S56,由新值A’[X]+V/SX替换当前换算值A”,其中A’[X]为顺序编号的换算值。这将表示V/SX的位加到换算值A”[X]中。
在步骤S57,V由V-V/SX取代。
在步骤S58,如果N不为0,则N按1减少,并且V的位的另一个集合通过步骤S55至57加到下一个抽样。如果N=0,则第0个抽样由A’[0]+Vmod S取代,它具有将V的剩余值加到第0个抽样的效果。
参照图19,从组合位流中抽取M个原始位的方法如下所述。
从步骤S62开始,得到N个抽样分组A’。并在步骤S63,最初将X和V设为0。然后在步骤S64,由新值V+(A’[X]mod S)*SX替换V的当前值。这样,对于第一计算X=0,因此V=A’[0]mod S。
如果在步骤S65 X不是N-1,则在步骤S66 X按1增加,并且在步骤S64 V由新值替换。那个循环重复,直到已经处理了所有N个抽样,V=V+A[4]modS*S4的最终值为恢复的原始位。
C)参照图6,加密材料文件附加到试听文件,如图13中示意所示。或者,加密材料作为非音频部分插入组合文件中。
减少组合文件的大小。
有可能的是,对于组合文件的给定文件大小,当采用上述组合方法A时,表示组合信号中的试听信号的MSB的数量可能过小而无法提供用户收听的足够的试听信号,但又不希望增加文件的大小。如果试听文件为多通道文件,则可能通过把该文件转换成单一通道(单通道)文件,使更多空间可用于表示试听信号的MSB。压缩并加密的音频可通过以上所述的任何方法放置在试听信号的LSB中。任何无法适合试听文件的LSB的加密音频,都可附加到试听信号(参照图13)或者作为非音频部分插入组合文件。
在一种方法中,如果文件具有两个通道(即为立体声文件),16位和7位中的每个都需要用于试听信号,则两个通道可转换为一个32位的单通道。那将可用于压缩并加密的信号的位从2*(16-7)[即18]增加到1*(32-7)=25。
在另一种方法中,只要每个抽样的位数大于通道的数量,则原始信号的格式可被保持,并且信号的每个通道由所有通道的单通道下折(mono fold-down)所取代。由于单通道信号是连贯的,因此这具有使分发文件的试听内容感觉上更大声的效果(对于每个增加的通道)。噪声是不连贯的,因此保持在未改变的感觉等级。因此,可使试听文件中的额外MSB可用于加密材料(对于各原始通道),除了损失多通道音频图像之外而没有损失感觉质量。
再一种方法产生原始信号的单一单通道表示,减少到原始通道其中之一的大小。这极大地减少了文件大小,允许任何多余的加密数据(在混合操作之后)附加到这个文件(或者作为非音频部分插入)。
在某些情况下可接受的一种用于减少组合文件的文件大小的方法,是采用标准下变换算法减少试听文件中的抽样的抽样率。这具有减少试听信号的频率范围和还有效地减少试听信号相对原始信号的文件大小的效果。加密音频放置在抽样的LSB中,如上所述。任何无法适合试听文件的LSB的加密音频,可附加到试听信号(参照图13)或者作为非音频部分插入组合文件。
如本部分所述的将多通道文件转换为单通道文件,也可与上述组合方法B(位分布)结合使用。
MPEG压缩
参照图7,试听信号的压缩器可以是MPEG压缩器。MPEG数据结构具有可用于辅助数据的数据空间和压缩音频的数据空间,如图14中的简化示意形式所示。在本例中,压缩并加密的音频信号放置在MPEG数据结构的辅助数据空间中。
因此,试听信号可采用MPEG再现设备进行再现。
不同于MPEG的压缩格式可提供等效的辅助数据空间。例如,MP3可与其中的辅助数据空间使用。
作为对采用辅助数据空间的补充或替代,压缩并加密的音频可附加到MPEG数据结构的尾部,如图13所示。
采用音频的块、段或部分的技术
部分加密及解密。
在某些情况下,可能希望仅允许原始材料的子部分从分发材料中提取。在这种情况下,当原始文件在压缩器2中被压缩时,它被分为固定长度的段(例如1秒、5秒、10秒),或者分为在特定点的部分。在影片或视频的音频轨道的实例中,这些部分可对应若干场景。本例中,不同的加密密钥用来对不同的段或部分加密,并保存在查找文件中供以后解密。本例中,压缩/加密文件必须包含在可确定点的信息(一般为部分或段边界),它们指示原始音频的哪部分或哪段包含在那个部分或段中。这个信息是必要的,因为所得到的压缩在整个压缩过程中不是恒定的,因此没有固定的方法用于从加密/压缩型式中的位置计算原始材料中的位置。这种模式中的压缩/加密可以若干不同方式中的一种来进行,这里列举其中的两种:
1.整个文件在单遍(single pass)中压缩。这通常产生最有效的压缩比率,但要求在压缩过程中那部分或段标题放置在压缩文件中。标题BH放在块边界以指示原始音频的什么部分包含在后续部分或段中;参见图12。
然后,所需长度的部分或段单独被加密,并采用如上所述的方法与试听信号混合。
加密数据的部分或段可按照以下方式来组织:
a)参照图9,这些部分或段基于在压缩过程中插入的标题数据BH。指示加密部分或段的部分或段标题SH1,在加密数据中提供。标题包含位置起始数据加上块长度数据、块ID数据以及可能的其它数据。位置起始数据在加密过程中从压缩数据标题BH中提取。这允许不需要对数据进行解密便可以定位部分或段。
b)或者,部分或段标题数据没有包含在加密数据中,在这种情况下,则需要依靠压缩数据的标题来定位部分或段。那要求对至少一些段进行解密,以便定位压缩数据中的标题。
2.原始文件被分为所需的段或部分,其中的每个都被单独压缩和加密。然后,所得压缩并加密的部分或段按照图9所示被连接。在这种情况下,段位置信息SH只需被嵌入加密文件中,尽管它本身没有加密。然后,包含标题SH的压缩并加密的文件与试听信号组合(如上述方法中的方式)。
适用于以上两种分段加密方法的修改是将段/偏移信息的完整查找表LUT放置在加密或压缩文件中的已知位置,这使正确的段或部分能够被迅速定位。
在这种变形中,解密和提取与上述方法中所描述的相似。当接收到提取分发文件的段或部分的有效请求时,利用保存在块标题中的信息,从查找文件中检索该段或部分的密钥,段或部分位于分发文件的加密数据(LSB)中,以及这些部分或段被解码。
如果用户请求提取比一段或部分长但不与部分或段边界重合的音频的一部分,则包含所请求部分的整个部分或段被提取,以允许正确的解密和解压缩。但是,提取了比所请求更多的数据。因此,包含所请求段之外的音频抽样的块被提取了。这些在解密和解压缩之后被丢弃。当选择原始文件分段的基础时,应当注意以确保可解码的段大小和容许的提取请求大小不允许大量抽样在音频的所请求部分之外被解码,因为它们可能可用于未经授权的使用。如果容许的段提取正好按照编码长度(例如在10秒边界),或者原始材料在段中明确编码并且提取请求限于那些段,则这种可能的安全缺口是完全可避免的。
自适应位分片。
较大声的音频信号比安静的音频信号更好地掩盖噪声。在这种自适应位分片变形中,破坏材料的信号电平在组合阶段之前或之中被分析,并被分为具有不同平均响度的块。这些块可以是由响度门限值确定的定长或可变长。然后由此生成的块序列可根据各块的响度采用位分片(MSB:LSB比)与加密数据组合。在这种方法中,第一信号的压缩及加密可在整个原始材料上执行,但是加密数据也在与试听材料相同的块边界处被分为若干块,各加密块的起始处的标题信息给出了在给定位分片处的抽样数量,这在加密数据随后当恢复原始信号时被提取时是需要的。
通过设置相似响度的音频的最大段大小(它允许对所需边界上的原始信号解密),该变形可与部分解密变形(以上所述)组合。
流式音频
在某些情况下,可能要求创建分发文件的操作应该在已经读取整个原始音频之前开始生成输出。如果原始音频是从网络连接而不是文件接收的,或者输出是在传输中加密用于在网络连接上分发,则情况可能是这样。在压缩或加密必须开始之前,当然不可能看到整个文件。随后的过程与上述的部分加密方法2的过程相似。主要差别在于:相同的加密密钥可用于所有块;采用预定块长度;以及不总是可能生成数据的编码型式的连续位流,因为所得到的压缩比率将逐个块有所不同。存在策略的选择,受到对于原始音频数据的各块所得到的实际压缩比率以及生成数据不必停止等待后续块的事实的影响。
a如果MSB:LSB分割是固定的,并且所实现的压缩不容许加密型式适合LSB流(甚至采用以上所述全部技术),则加密数据的额外位在分发数据块已经包装之后仍然保持,则这些额外位必须放置在下一个块的加密数据的头。
b如果MSB:LSB分割是固定的,并且所实现的压缩表示加密型式小于分发材料的LSB中的可用空间,则用随机噪声填充剩余的LSB。
c如果MSB:LSB分割是可变的,并且所实现的压缩不容许加密型式适合LSB流,则改变MSB:LSB分割以便可接纳所有加密数据的位,或者(如果达到分割的实际极限)将加密数据的额外位移到下一个块的头。
d如果MSB:LSB分割是可变的,并且所实现的压缩表示加密型式小于分发材料的LSB中的可用空间,则可用随机噪声填充剩余的位,或者可提高MSB:LSB分割以允许来自试听音调的更多MSB被听到。
注意,在情况c和d中,如果改变MSB:LSB分割,则有可能分发信号的SNR将逐个块有所不同。在良好/不良压缩的原因是由于原始信号在那些块中是安静/大声(更高的噪声通过更大声的信号来更好地屏蔽)的情况下,这可能是可接受的,并且是优选方法,因为邻近块通常得到相似的压缩比率。
在“位分布”部分描述的方法也可应用于流式音频。
浮点格式
以上描述假定数字音频以定点格式表示。但是,数字音频可以浮点格式表示。本领域的技术人员会知道,浮点格式可能导致更复杂的处理。
组合系统(图8)
已经参照图1至7描述了本发明,它们分别示出了处理音频信号的各个不同的方法。上述各种方法均可由图8所示的设备来实现。下面将描述图8,但可通过设备实现的上述各种方法的描述在此不再赘述。
图8与图1至7的设备的不同之处如下:
由压缩器2实现的压缩比率可被测量,并且如果提供了试听信号的压缩器16、18、181,则该压缩器16、18、181的压缩比率可根据所测量的压缩比率来控制。那使试听信号的压缩可被调整,以提供给定文件大小的表示试听信号的压缩MSB对表示压缩并加密的原始音频的LSB的适当比率。作为替代或补充,试听信号与压缩并加密的原始音频信号组合的方式可以根据所测量的压缩比率来选择,它还使能选择给定文件大小的MSB(表示试听信号)对LSB(表示压缩并加密的原始音频)的适当比率。
图8还包括控制面板20,它可以是作为计算机的图形用户界面提供的虚拟控制面板,它使用户能够设置设备的各种操作参数。控制面板可设置下面的一项或多项:
a)在提供一组破坏者信号时的破坏者信号的选择。
b)破坏者信号和被破坏的信号的相对信号电平。
c)在如上所述提供一组调制时的调制的选择。
d)由试听信号的压缩器16、18、181提供的压缩类型。以上描述了各种压缩类型。
e)试听信号与压缩并加密的原始音频信号的组合类型。以上描述了各种类型。
f)音频的块或段或部分的类型。块可以是定长或可变长的。段或部分可以是固定或者可变的。它们可被选择以对应如上所述的场景变化。控制面板可用来指定场景变化位置。
g)控制面板可用来添加关于部分或段的信息。
h)原始(无标题)PCM文件的参数,例如抽样率、抽样格式等。
图8的系统可由操作人员控制以选择并操作在上述方式的一种,或者可通过计算机程序来如此控制。
再现设备
参照图15,示出了再现设备(又称作播放器)的一个实例。组合文件或位流在输入50接收,并经由解压缩器51(对应于上述压缩器16、18或181)或者直接馈送到再现级54,再现级54可用来再现未压缩的试听信号。开关53根据试听信号是否被压缩来选择到输入50或解压缩器51的直接连接。
如果再现设备还打算再现压缩并加密的音频,则它还包括:分离器55,它将加密并压缩的音频从试听信号分离;解密器56,它采用密钥3对分离信号进行解密;解压缩器57;以及再现级58,它再现原始音频。
参照图16,对于例如图11或12所示的数据结构,分离器55解析S2位流并检测S4标题,以便确定LSB与MSB之间的边界的位置。表示试听信号的MSB则被丢弃S6,留下由LSB表示的加密并压缩的音频。
如果第一和第二信号通过上述“位分布”部分所述的方法来组合,则采用参照图19所述的方法对它们进行分离。
然后,解密密钥或多个解密密钥被获得S8,并用来对LSB解密S10。解密音频然后被解压缩S12。
对于例如图13和图14所示的其它数据结构,组合数据结构被解析S2,以确定加密并压缩的音频的位置,以及丢弃S6试听信号。
事务处理系统
参照图17,本发明可实现为通过其交易音频或其它任何数据的系统的一部分。在图17中,为了便于描述而采用术语“卖方”和“买方”。虽然那些术语可表示其通常意义,即意味着供应商完全是为了报酬把音频卖给买方,但它们在这里也更广泛地用来表示音频可由可能代表该音频的创作者和/或拥有者的个人或机构(卖方)使可能付费以便在预定商业条件下使用音频的另一个人或机构(买方)可以使用,但不一定发生音频所有权的转移。
参照图17,根据本发明的系统的第一实例包括事务处理服务器62、卖方客户机60、买方客户机61以及将客户机链接到服务器的通信网络64。
材料的拥有者即卖方控制卖方客户机60。买方控制买方客户机61。本例中,第三方拥有并控制事务处理器62,尽管事务处理器可由例如卖方拥有并控制。该系统允许音频材料如上述的被获取、安全且可感觉地破坏或受损,并被传送给买方,供买方试听(69)受损的音频材料。然后,如果买方想购买原始未受损的音频材料,则买方从事务处理服务器62得到访问未受损音频所需的数据。本例中,卖方和买方均用事务处理服务器进行注册(651,652)。用于访问未受损音频的数据仅当买方对该材料已经付费时才从事务处理服务器发送给买方。付费由与金融机构63进行通信的事务处理服务器62监测。付费经由服务器62和/或经由机构63进行。
与卖方客户机60相关联的是用于如上所述的破坏音频材料的第一设备66。设备66可以是如图1至9以及图18和图19中的任一个所示。加密音频的解密所需的密钥从设备66传送,以与标识该材料的标识符一起存储在事务处理服务器64中。与买方客户机61相关联的是用于访问未受损音频的第二设备68。这种设备可如图15和图16所示。
内容试听设备69也在图17中指示,与买方客户机61相关联用于收听试听信号。这种设备可包括图15中的单元50、51、52、53和54,它们使买方能够再现试听信号。
卖方客户机和买方客户机可以是实现音频的受损以及访问试听信号和未受损音频的计算机。作为注册过程的一部分,用于实现原始音频的受损的软件可由服务器提供给卖方客户机。同样,用于访问未受损音频的软件可由服务器提供给买方客户机。
本例中,材料为音频材料,并记录在诸如磁带、光盘或其它存储器等的记录媒体9上,或者是来自外部源的位流。材料由第一设备66获取及处理。另外,材料标识还应用于材料。然后,包含标识符的材料在媒体9上传送到第二设备68、69。例如通过邮局传送。或者,音频材料可经由网络64传送。
标识符在获取过程中或者在处理材料过程中被应用于音频材料,以使密钥能够与音频相关联,并使买方、卖方和事务处理服务器能够管理音频材料的买和卖。标识符的一个实例是唯一材料标识符即UMID。在2000年3月的SMPTE杂志中更详细地描述了UMID。
为了得到未受损音频,买方对音频付费,并从服务器64得到解密密钥。
在作为EP-A-1215907公布的欧洲专利申请中更详细地描述了如图17所示的系统,通过引用将它结合于此。
在一个备选实例中,没有事务处理服务器,并且卖方经由网络直接与买方通信。
在另一个备选实例中,卖方客户机和买方客户机均可在同一台计算机上实现。
本发明还可在对等的网络中实现。
在又一个备选实例中,没有事务处理服务器62。具有买方处理器61的买方经由网络64与具有卖方处理器60的卖方进行通信,以便经由网络或者发送给买方的磁带或光盘或其它记录媒体得到组合音频数据。如果买方喜欢该试听信号,则买方直接或者经由连接到网络的金融机构63为解密密钥向卖方付费。然后,卖方将解密密钥发送给买方。
下推系统和下拉系统
参照图17所述的事务处理系统是“下拉”系统,在其中买方请求卖方将试听信号传送给买方。
本发明可用于“下推”系统,它的一个实例是广播系统,在其中音频被传送到所有可能的用户。然后,如果用户希望获取未受损的音频,则他们请求发给解密密钥。
与音频信号组合的计算机程序
在上述实例中,第一信号是与第二音频信号组合的压缩并加密的数字音频信号,它是试听信号。在某些实例中,加密使第一信号随机化,以便它被嵌入第二信号时表现为噪声。在其它实例中,第二信号被压缩,并且第一信号被嵌入压缩的试听信号的辅助数据空间中,和/或附加到压缩的第二信号。
在本发明的开发中,第一信号为计算机程序,它可以或者可以不被压缩,并且可以或者可以不被加密。本例假定它既没有压缩也没有加密。第二信号是音频信号。组合信号记录在记录媒体例如光盘上。
计算机程序为:
a)根据上述方法其中之一,嵌入第二信号中(它可以也可以不被压缩)。在这种情况下,第一信号不需要加密,但它最好被加密。如果计算机程序被压缩,则它是无损压缩。
或者,计算机程序为
b)根据上述方法,嵌入压缩的第二信号中的和/或附加到压缩的第二信号尾部的辅助数据空间中。它最好经过加密,尤其是当它只是附加到第二信号时。如果计算机程序被压缩,则是无损压缩。
第二信号可以是音乐。第二信号可能包含表明计算机程序在光盘上并对于如何对它进行访问给出指令的通知。