声音信号过滤和压缩的方法与装置 相关申请参考
本申请主张2000年8月7日受理的60/223,567号美国临时申请的权利,题名为“听力损失过滤和压缩的方法”,下文参考了该专利的内容。
发明背景本发明所属领域
本发明涉及声音信号处理,特别是,涉及能改进声音信号过滤和压缩的助听器。相关技术描述
人类的听力是一种非常灵敏的声音接收装置。外耳采集到的声音与耳膜产生共振。耳膜的振动经过中耳传递给内耳(耳蜗),在基膜部产生振动波。接着,振动波通过耳蜗的绒毛细胞和神经纤维产生电子脉冲,最后传递给大脑。大脑解释耳蜗内不同的尖峰信号速度和分布位置,辨别不同的声音。
外耳和中耳的声音处理或多或少是线性的,而内耳(耳蜗)的声音处理则绝对是非线性的,或者说,是可压缩的。声音输入地动态范围高达120dB,而神经中枢响应的动态范围只有60dB。正是内耳绒毛细胞的可压缩性使得更高动态范围的声音可以压缩成较小的动态神经响应。
听力损失常常与内耳绒毛细胞的能听度和压缩处理损失有关。而且多数情况下,损失与频率相关。这有利于助听器在一个宽泛的动态范围内利用与频率相关的放大和压缩。然而,多波段非线性处理常常造成失真,所以在利用这种频率放大和压缩时,必须注意避免不必要的失真。
Edgar Villchur第一个提出在助听器中利用多波段压缩处理方法。见“提升感知性耳聋语音可懂度的信号处理”,美国声学学会期刊,53卷,第6期,1646-1657页,1973年。本文还参考了美国4,882,762号专利提出的利用模拟电路实现多波段可编程压缩系统的常规方式。图1表示的是基于Villchur理论的多波段压缩处理基本原则。
图1是常规多波段压缩处理系统100的框图。常规多波段压缩处理系统100包括一个过滤库102,将输入的声音信号分离成不同的频率波段。然后,单个的频率波段信号被提供给能量估测和增量计算电路104和乘法器106。能量估测和增量计算电路104产生的增量被分别提供给乘法器106。每个频率波段的增量都基于对该频率波段内信号能量的估测。乘法器106根据各个增量放大(或削弱)特定频率波段的信号,得到放大后的信号。加法器108将放大后的信号相加,产生输出声音信号。
本文参考了美国第5,500,902号专利中描述的这种用于多波段压缩处理系统的过滤库。实际还有很多方式可以实现多波段压缩处理。这些方式的差别在于过滤库的选择和能量估测器的时间连续性。
外围听觉系统的功能模型可以看作是一个相互交迭的过滤库。听力损失意味着过滤器的带宽稍微大了一点。听觉过滤器带宽过大造成了频率选择方面的缺陷,而且这种缺陷不太可能恢复,因为最终控制整个系统频率选择的是听觉过滤器,而不是助听器里的电子过滤器。然而,可以用较窄的电子过滤器来精确地调整对声音的频率响应,从而补偿与频率相关的听力损失,特别是对低水平信号的听力损失。心理声学实验表明如果两个声音的频率被分离为一个以上关键波段,这两个声音都会影响主体对声音的感知。如果这两个声音被分离为一个以下关键波段,只有较强的那个声音才会决定对声音的感知。因此,电子过滤库的最佳带宽应该接近关键波段。
另一方面,尽管窄带压缩装置能更准确地调整频率,但它很可能严重改变短期波谱对比度。它确实有利于听见更多的频率,从而提高低水平语音的可懂度。可对于中高水平的语音而言,是否能听到已不再是主要的问题,更为重要的是语音的清晰度和质量。短期波谱在语音清晰度和质量感知方面扮演着重要角色,因此,过分改变短期波谱是有害的。在实际的多波段压缩器中,通常的折中方法是采用带宽远远高于关键波段的过滤库。
因此,需要改进多波段压缩处理过程的技术。
发明概述
广义地说,本发明是一种通过过滤和压缩声音信号获得低水平语音能听度和可懂度,并保持高水平语音的波谱对比度的改进方法。根据本项发明的其中一项应用,不同频率波段的增量是依据频率波段的信号级别而分别受到相应限制的。因此,每个频率波段的增量是否受限制取决于相应的信号级别。这样,在一个相当宽的声音信号级别域内,听力受损的人还是能得到那些与语音可懂度、清晰度及质量相关的大多数关键信息。本项发明对助听器或听力受损者所用的其它声音系统尤为有用。
本发明可以有多种应用方式,可以作为一种方法、系统、装置、设备或计算机可读的媒介。下文将讨论本发明的几个实施例。
作为一种听力受损者处理声音信号的方法,本发明的一个实施例至少包括以下动作:过滤声音信号以获得至少两个频道的频道信号;确定每个频道信号的估测信号级别;确定每个频道信号的初始增量;以相应的估测信号级别为基础,根据与至少一个相邻频道相关的增量限制每个频道信号的初始增量;根据相应的限制后初始增量放大频道信号。
作为一种多波段声音处理系统中放大声音信号的方法,本发明的一实施例至少包括以下活动:接收与一个声音信号特定的频率波段相应的频道信号级别估测值;根据信号级别估测值确定相配的增量。当信号级别估测值处于高水平时,相配的增量会受到限制,以保持不同频率波段间波谱的对比度,从而保证语音的清晰度和可懂度。
作为一种多波段声音处理系统中放大声音信号的方法,本发明的一实施例至少包括以下活动:接收与一个声音信号特定的频率波段相应的频道信号级别估测值;根据信号级别估测值确定相配的增量。当信号级别估测值处于高水平时,相配的增量会受到限制,以控制不同频率波段间的增量差异,从而保证语音的清晰度和可懂度。
作为一种听力受损者处理声音信号的方法,本发明的一实施例至少包括:一个将声音压力信号转换为电子声音信号的麦克风,一个信号处理元件,和一个将经过处理的电子声音信号转换成声音压力信号的接收器。信号处理元件的作用是过滤电子声音信号,获得至少两个不同频率波段的频道信号;确定每个频道信号的信号估测值;根据信号估测值确定每个频道信号的初始增量;将该初始增量与相邻频道的其他增量合并,限制该频道信号的初始增量,产生限制后的增量;根据限制后的初始增量放大频道信号;以及将放大的频道信号融合进经过处理的电子声音信号。
作为一种多波段声音处理系统中放大声音信号的系统,本发明的一实施例至少包括:一个将声音压力信号转换为电子声音信号的麦克风,和一个与麦克风相连的信号处理元件。信号处理元件的作用是过滤电子声音信号,获得至少两个不同频率波段的频道信号;接收每个频道信号的信号级别估测;以及根据与每个频道信号对应的信号级别估测值确定相配的增量。而且,当信号级别估测值处于高水平时,相配的增量会受到限制,以保持不同频率波段间的波谱对比度。
作为一种多波段声音处理系统中放大声音信号的系统,本发明的另外一个实施例至少包括:一个将声音压力信号转换为电子声音信号的麦克风,和一个与麦克风相连的信号处理元件。信号处理元件的作用是过滤电子声音信号,获得至少两个不同频率波段的频道信号;接收每个频道信号的信号级别估测;以及根据与频道信号对应的信号级别估测值确定相配的增量。而且,当信号级别估测值处于高水平时,相配的增量会受到限制,以控制不同频率波段间的增量差异。
作为一种助听器,本发明的一实施例包括至少一个采集声音信号的麦克风,用于处理声音信号以获得调整后声音信号的信号处理电路,以及根据调整后声音信号产生输出声音的输出装置。信号处理电路的作用是过滤声音信号,使之变成多个不同频率波段的频道信号;获得每个频道信号的信号级别估测值;以及以信号级别估测值为基础,决定频道信号相配的增量。在确定相配增量的过程中,当信号级别估测值较高时,相应的增量会受到相邻频道信号增量的限制。
作为一种至少包括了用于处理声音信号的计算机程序代码的计算机可读媒介,本发明的一实施例至少包括:用于过滤声音信号获得频道信号的计算机程序代码;用于确定频道信号估测信号级别的计算机程序代码;根据估测的信号级别确定频道信号初始增量的计算机程序代码;用于以估测的信号级别为基础,根据相邻频道的增量限制初始增量的计算机程序代码;以及用于根据限制后初始增量放大频道信号的计算机程序代码。
下文结合附图进行的详细说明将显而易见地体现本发明的其他方面和优势,同时,这些附图以示例的方式体现了本发明的原则。
附图简要描述
下文结合附图进行的详细说明将使本发明很容易被理解。附图中的相同的标号代表相同的结构元件,其中:
图1是常规多波段压缩处理系统的框图。
图2是根据本发明的一实施例,多波段声音处理系统的框图。
图3是根据本发明的一实施例,声音放大处理过程的流程图。
图4是根据本发明的一实施例,增量限制处理过程的流程图。
图5是根据本发明的另一实施例,增量限制处理过程的流程图。
图6是根据本发明的一实施例,增量限制元件的框图。
图7-10是根据本发明的一实施例,用于图6所示的增量限制元件的增量限制块的典型功能的框图。
图11是根据本发明的一实施例的声音处理系统。
发明的详细描述
本发明是一种通过过滤和压缩声音信号获得低水平语音能听度和可懂度,并保持高水平语音的波谱对比度的改进方法。根据本项发明的一个方面,不同频率波段的增量是依据频率波段的信号级别而分别受到相应限制的。当信号级别较低时,增量不会受到限制以保证最优能听度。当信号级别比较高时,其增量就会受到限制,从而保持波谱的对比度。这样,在一个相当宽的声音信号级别域内,听力受损的人还是能得到那些与语音可懂度、清晰度及质量相关的大多数关键信息。本项发明对助听器或听力受损者所用的其它声音系统尤为有用。
以下参照附图2-11讨论本发明的实施例。但是,本领域技术人员很快就会发现,这里提供的详细描述仅仅是用于解释说明,实际上这项发明的应用和意义远不止此。
图2是根据本发明的一实施例多波段声音处理系统200的框图。多波段声音处理系统200先接收到一个声音信号,然后输出一个经过压缩的声音信号,也就是将原声音信号经过放大后输出。而且该声音信号的不同波段是被分别放大的,从而使与频道相关的声音(如语音)不仅能够被听到,同时还保留了足够的波谱对比度。虽然图2中没有标出,但声音信号通常是由麦克风传出,压缩后的声音信号会输出到一个接收器(如扬声器)。
多波段声音处理系统200包括一个过滤库202,由它来接收声音信号,产生与不同频率波段对应的多个频道信号CS1,CS2,...,CSn。每一个频道信号(CS)都被导入到能量估测和增量检测电路204中。特别是,频道信号CS1,CS2,...,CSn被分别传送到能量估测和增量检测电路204-1,204-2,......,204-n中。每一个能量估测和增量检测电路204产生一个信号级别(L)和一个初始增量(G)。也就是说,能量估测和增量检测电路204-1产生信号级别L1和初始增量G1。能量估测和增量检测电路204-2产生信号级别L2和初始增量G2。能量估测和增量检测电路204-n产生信号级别Ln和初始增量Gn。
由能量估测和增量检测电路204确定的信号级别(L)和初始增量(G)被传送给一个增量限制元件206。增量限制元件206对特殊频率波段的增量进行限制,因此,尽管频道信号(CS)被放大了,但也能保持不同频率波段的波谱对比度。在一个实施例中,依据频率波段的信号级别(L)限制该频率波段的初始增量。比如说,如果信号级别(L)足够高,那么增量(G)就能限制在某一水平,从而保持相近的不同频率波段之间的增量差异。增量限制元件206为每一个频率波段输出最终增量(FG)。换句话说,增量限制元件206是对每一个频率波段进行独立处理。最终增量(FG)也可以称作限制增量。
最终增量(FG)分别表示为FG1,FG2,...,FGn。最终增量FG1,FG2,...,FGn各自被传送到乘法器208-1,208-2,...,208-n中。此外,频道信号CS1,CS2,...,CSn也被各自传送到乘法器208-1,208-2,...,208-n中。乘法器208-1,208-2,...,208-n分别乘上相关的频道信号(CS)和最终增量(FG),产生被限制的频道信号CCS1,CCS2,...,CCSn。接着加法器210将这些被限制的频道信号CCS1,CCS2,...,CCSn相加,得到压缩后的声音信号。
值得注意的是,乘法器208通常也能用来放大频道信号(CS)。所以,乘法器208也可用于其它处理频道信号(CS)的逻辑或数学运算,放大其信号级别。而加法器210通常是一个合成器,用于合成各个波段中被限制过的频道信号(CCS),从而产生压缩后的声音信号。因此,在产生压缩声音信号的过程中,可以通过加法器210进行各种逻辑运算,包括加减法。
多波段声音处理系统200有多种使用方式。在一实施例中,多波段声音处理系统200通过一块集成电路装置内的固件来运行,如数码信号处理器(DSP)或专门应用集成电路(ASIC)。另一实施例中,多波段声音处理系统200用软件运行。另一实施例中,多波段声音处理系统200用硬件运行。另一实施例中,多波段声音处理系统200通过固件、软件和硬件结合起来使用。
图3是根据本发明的一实施例,声音放大处理过程300的流程图。声音放大处理过程300通过多波段声音处理系统,如图2所示多波段声音处理系统200,来实现。
在声音放大处理过程300首先接收一个待处理的声音信号302。接着,该声音信号经过过滤304得到一个频道信号。通常过滤304会产生多个频道信号,每个都与不同频率波段相关。每个频道信号都经过类似处理。因此,对声音放大处理过程300的讨论也就和处理一个与声音信号相关的频道信号有关。
得到频道信号后,频道信号的信号级别可以估测306。然后,频道信号的初始增量可以确定308。在一实施例中,频道信号的初始增量是根据估测的信号级别确定308。一般来说,如果需要放大声音,那么估测的信号级别越低,其初始增量越大。
初始增量确定308后,根据估测的信号级别限制频道信号的初始增量310。在一实施例中,当估测的信号级别很低时,对初始增量很少或不进行限制,当估测的信号级别相当高时,对初始增量进行较大程度的限制。在一实施例中,限制会受到附近其他频率波段的频道信号增量(比如初始增量)的影响。在初始增量在需要的程度限制310后,频道信号根据限制后的初始增量放大312。操作312后,声音放大处理过程300完成并结束。
通常,对与声音信号不同频率波段相关的频道信号的处理方式都是类似的。因此,声音放大处理过程300也就可以合并不同频率波段的放大频道信号,产生一个被压缩的声音信号。
图4是根据本发明的一实施例,增量限制处理过程400的流程图。增量限制处理过程400通过增量限制元件,例如图2所示的增量限制元件206,来实现。
增量限制处理过程400首先接收一个特定频率波段的信号级别估测值和一个初始增量(IGA)402。一决定404确定该信号级别估测值是否低于临界值。当决定404确定该信号级别估测值低于临界值,初始增量就会被选择为输出增量406。当决定404确定该信号级别估测值不低于临界值,就对初始增量限制408。初始增量被限制408后,经过限制的初始增量被选为输出增量410。操作406和410完成后,增量限制处理过程400就完成并结束。
通过限制408某一特定频率波段信号的增量,在保证充分放大低水平信号的同时,很好地保持了波谱的对比度。初始增量限制408有多种方式。在一个实施例中,初始增量通过取得与临近(如相邻的)频率波段的初始增量的平均值来限制408。在该实施例中,限制408是为了减少不同频率波段间增量的差异变化,从而保持不同频率波段间的波谱对比度。
图5是根据本发明的另一实施例,增量限制处理过程500的流程图。增量限制处理过程500首先接收502一个频率波段的频道级别(CL)。频道级别与第一和第二临界值(TH1 and TH2)比较504。此外,接收该频率波段的初始增量506。应该注意的是,如果不是被直接接收的,初始增量还可以由频道级别或其他方式来决定。增量限制处理过程500同时也接收508多个临近频率波段的其它增量。在一实施例中,这些其他增量是其它的初始增量。
接着决定510确定频道级别是否低于第一临界水平。当决定510确定频道级别低于第一临界水平,初始增量被选择512为输出增量(OGA)。当决定510确定频道级别不低于第一临界水平,则决定514确定频道级别是否高于第二临界值。当决定514确定频道级别高于第二临界值,则初始增量和其他增量平均516。相反,如果决定514确定频道级别不高于第二临界值,则初始增量和其他增量的子集平均518。操作516和518完成后,平均后的初始增量则被选择520为输出增量。在操作512或520结束之后,增量限制处理过程500就完成并结束。
应该注意的是,操作516和518中的平均值操作既可以是加权的也可以是不加权的。加权平均值首先按比例确定每个增量,然后对比例增量再进行数学平均运算。
图6是根据本发明的一实施例,增量限制元件600的框图。增量限制元件600适合使用,例如,图2所示的增量限制元件206。增量限制元件600包括n个增量限制块602-612。在一实施例中,每个增量限制块602-612理论上可以共享一种设计。然而,典型的增量限制块602-612通过信号处理操作实现。
增量限制块602-612中的每一个限制块都接收一个特定频率波段的输入信号级别,该特定频率波段的输入增量级别,以及一个或者更多其他频率波段的增量级别。增量限制块602-612输出增量级别(Gain_out)。如图6所示,增量限制块602接收信号级别L1与增量级别G1和G2,输出一个输出增量级别(Gain_out1)。增量限制块604接收信号级别L2和增量级别G1,G2和G3,输出一个输出增量级别(Gain_out2)。增量限制块606接收信号级别L3和增量级别G1,G2,G3和G4,输出一个输出增量级别(Gain_out3)。增量限制块608接收信号级别L4和增量级别G2,G3,G4和G5,输出一个输出增量级别(Gain_out4)。增量限制块610接收信号级别L(n-1)和增量级别G(n-1),G(n-2),G(n-3)和Gn,输出一个输出增量级别(Gain_out(n-1))。最后,增量限制块612接收信号级别L(n)和增量级别G(n),G(n-1),和G(n-2),输出一个输出增量级别(Gain out(n))。
图7是根据本发明的一实施例,增量限制块700的典型功能化框图。增量限制块700可以如图6所示的增量限制块602操作。
增量限制块700包括一个可以运行比较操作的关系运算子702。关系运算子702接收信号级别L1和第一临界水平(参考水平)。本实施例中,第一临界水平是35dB。关系运算子702比较信号级别L1和第一临界水平。基于该比较,通过关系运算子702输出逻辑运算符”0”或”1”。同样,关系运算子704接收信号级别L1和第二临界水平。本实施例中,第二临界水平45dB。关系运算子704也输出逻辑运算符“1”或者“0”。关系运算子702和704的输出将被传送到汇总电路706中。接着汇总电路706把关系运算子702和704的输出值与一恒定的输入值”1”相加。汇总电路706的输出值就作为一个控制输入值传给一个多端口开关708。控制输入选择将哪个多端口开关708的输入值作为增量输出(Gain_out1)。多端口开关的第一输入值是由增量限制块700接收的一个增量(G1)。增量限制块700同时还包括一个汇总电路710和一个增量电路712,它们共同向多端口开关708提供第二个输入值。汇总电路710将增量G1和信号“0”相加,因此有效地向增量电路712提供了增量G1。因为增量电路712的增量是“1”,向多端口开关708输入的第二个增量值就是G1。此外,增量限制块700还包括汇总电路714和增量电路716,它们共同向多端口开关708提供第三输入值。汇总电路714将增量G1和增量G2相加。汇总电路714将增量的输出提供给增量电路716,以在把信号输入到多端口开关708之前,把信号级别降低一半。换句话说,汇总电路714和增量电路716对增量G1和G2进行平均运算。
图8是根据本发明一实施例,增量限制块800的典型功能化框图。增量限制块800,例如,可以适于用作图6所示的增量限制块604。此处的增量限制模块800与图7类似,包括了功能模块702-716。然而,功能模块702-716的使用不太一样。特别是,在关系运算子702和704接收信号级别(L2)方面。汇总电路710把增量G1和增量G2相加,然后增量电路712把信号级别降低二分之一。也就是说,汇总电路710和增量电路712对增量G1和增量G2进行了平均运算。同样,汇总电路714和增量电路716将对增量G1,增量G2和增量G3进行平均运算。
图9是增量限制块900的典型功能化框图。增量限制块900,例如,适于用作图6所示的增量限制块606。在这里,增量限制模块900与图7相似,包括功能模块702-716。但功能模块702-716的使用不太一样。特别是在关系运算子702和704接收信号级别(L3)方面。汇总电路710和增量电路712会共同对增量G2和G3进行平均运算。同样的,汇总电路714和增量电路716共同对增量G3,增量G2,增量G1和增量G4进行平均运算。本实施例中,第一和第二临界水平分别变为33和43dB。
图10是根据本发明的一实施例,增量限制块1000的典型功能化框图。增量限制块1000与图7所示的增量限制块700类似,包含了功能模块702-716。然而,功能模块702-716的使用方式有些不同。增量限制块1000与nth信号级别及其处理相关。第一和第二临界水平分别变为28和38dB。关系运算子702和704接收信号级别L(n)。汇总电路710和增量电路712用于对增量G(n)和G(n-1)进行平均运算。同样的,汇总电路714和增量电路716则共同对增量G(n),增量G(n-1)和增量G(n-2)进行平均运算。
上面讨论的声音处理系统和操作尤其适用于辅助听力或其他为听力损失者设计的声音系统。图11是根据本发明的一实施例的声音处理系统1100。声音处理系统1100可以用作助听器的一种声音处理系统。助听器是用来为有听力障碍的使用者放大声音的。声音处理系统1100包含一个多波段声音处理系统1102,它可以对超过16种(包括16种)不同的频率段进行操作,从而产生一个经过压缩的声音信号。多波段的声音处理系统1102可以是,例如,图2所示的多波段声音处理系统200。此外,声音处理系统1100也可以包含助听器经常需要的其它的一些特点和可操作过程。特别是如图11所示,声音处理系统1100可以包含一个适应性的导向处理元件1104,它接收来自于麦克风的声音信号并随之进行适应性的导向处理。声音处理系统1100也可以包含一个具有适应性的回声消除元件1106,用以消除回声和类似功能。
本项发明可以在固件、软件、应用型集成电路、硬件,或者是固件、软件、应用型集成电路、硬件的结合体实现。本发明也可以作为计算机可读代码在计算机可读媒介上实施。计算机可读媒介是指任何可以存储数据并可以被一个计算机系统读出的数据存储装置。计算机可读媒介的例子包括只读存储器、随机存储器、光盘存储器、磁带、光数据存储装置和载波。计算机可读媒介也可以通过网络连接的计算机系统进行传播,以便计算机可读代码可以一种传播的方式进行存储和运行。
本发明的优点很多。不同的实施例或实施方式可以体现其一种或更多的以下优点。本发明的一个优点是,其改良过的声音信号处理过程可以使助听器更好地帮助那些有听力障碍的人。本发明的另一个优点是,声音信号处理过程覆盖一个较大的动态范围,既可以加强中低水平声音信息的语音能听度,又可以加强中高水平声语音的清晰度和质量。本发明的另一优点是可以保持中高水平声音输入的不同频率波段的波谱对比度。本发明的另一优点是,声音增量之间的转换可以一种让使用者感觉流畅的方式进行。
从上面的描述中我们可以明显看出本发明的各项特征和优点,随后的权利要求意在覆盖本发明的所有的特点和优势。然而,由于本领域技术人员可对本发明进行大量修改和调整,描述和说明的实际结构和操作不对本发明限制。因此,对之所作的所有适当修改以及同等产品都可以被看作属于本项发明的范围。