干扰抑制技术.pdf

上传人:b*** 文档编号:1132014 上传时间:2018-04-01 格式:PDF 页数:43 大小:2.10MB
返回 下载 相关 举报
摘要
申请专利号:

CN01812199.3

申请日:

2001.05.10

公开号:

CN1440628A

公开日:

2003.09.03

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回|||公开

IPC分类号:

H04R3/00; H04R25/00

主分类号:

H04R3/00; H04R25/00

申请人:

伊利诺伊大学评议会;

发明人:

D·L·琼斯; M·E·洛克伍德; R·C·比尔格尔; A·S·冯; C·R·兰兴; W·D·奥布里恩; B·C·韦勒; M·埃尔勒格; 刘宸

地址:

美国伊利诺伊州

优先权:

2000.05.10 US 09/568,430

专利代理机构:

中国专利代理(香港)有限公司

代理人:

吴立明;陈霁

PDF下载: PDF下载
内容摘要

所公开的系统(10)包括声频传感器阵列(20),其与处理器(42)连接。系统(10)处理来自阵列(20)的输入,通过抑制干扰信号将要求的声频信号引出。使用使得到的输出信号方差最小所选定的加权通过修正频域中阵列(20)的输入来进行引出/抑制,同时使在要求声频信号方向上接收到的信号的放大倍数保持为单位放大倍数。系统(10)可以应用在助听器,语音输入装置,监听装置,及其他应用中。

权利要求书

1: 一种方法,其包括: 用若干个声频传感器检测声频激励,所述声频传感器提供相应数 量的传感信号; 对各传感器信号建立若干个频域分量;及 确定代表指定方向声频激励的输出信号,所述确定包括对各传感 器信号的分量进行加权以减小输出信号的方差并向指定方向的声频激 励提供预定的放大倍数。
2: 权利要求1的方法,其中所述确定包括使输出信号的方差最小 和使预定放大倍数近似于单位1。
3: 权利要求1的方法,其进一步包括改变指定的方向而不移动任 何声频传感器以及在该改变后重复所述建立和确定。
4: 权利要求1的方法,其进一步包括通过移动一个或多个声频传 感器来从指定方向进行改变并在该改变后重复所述建立和确定。
5: 权利要求1的方法,其中所述相应于傅立叶变换的分量和所述 加权包括计算若干个加权使其受预定放大倍数大体保持在单位1的条 件限制下的输出信号方差最小,而加权则被确定为频域关联矩阵和对 应于指定方向向量的函数。
6: 权利要求5的方法,其进一步包括经常重新计算加权并在既定 基础上重复所述建立和确定。
7: 权利要求1的方法,其进一步包括计算受声频传感器间非实际 存在的放大倍数差条件限制下的加权。
8: 权利要求1的方法,其进一步包括调节关联因子来控制束宽随 频率的变化。
9: 权利要求1的方法,其进一步包括计算若干个关联矩阵以及自 适应地改变一个或多个关联矩阵对至少一个其他关联矩阵的关联长 度。
10: 权利要求1的方法,其进一步包括跟踪至少一个声频信号源位 置随声频传感器间相位差的变化。
11: 权利要求1-10之一的方法,其进一步包括提供具有声频传感 器的助听器以及可操作其完成所述建立和确定的处理器。
12: 权利要求1-10之一的方法,其中语音输入装置包括声频传感 器以及可操作其完成所述建立和确定的处理器。
13: 一种方法,其包括: 在存在多个声频源的情况下操作包括若干个声频传感器的助听 器,声频传感器提供相应数量的传感器信号; 监测选定的一个声频源; 对各传感器信号确定一组频率分量;及 产生代表该选定声频源的输出信号,该输出信号是使输出信号方 差最小而算出的、各传感器信号的这组频率分量的加权组合。
14: 权利要求13的方法,其进一步包括对输出信号进行处理以向 助听器使用者提供至少一个声频输出。
15: 一种方法,其包括: 操作包括若干个声频传感器的语音输入装置,声频传感器提供相 应数量的传感器信号; 对各传感器信号确定一组频率分量;及 产生代表指定方向声频激励的输出信号,输出信号为使输出信号 方差最小而算出的、各传感器信号的这组频率分量的加权组合。
16: 权利要求15的方法,其中语音输入装置包括在计算机的语音 识别系统中。
17: 权利要求13-16之一的方法,其中所述产生包括计算若干个 加权随频域关联矩阵和对应于指定方向向量的变化。
18: 权利要求17的方法,其进一步包括经常重新计算加权。
19: 权利要求17的方法,其进一步包括确定传感器信号的加权组 合随与指定方向相关联的放大倍数限制的变化。
20: 权利要求17的方法,其进一步包括调节关联因子来控制束宽 随频率的变化关系。
21: 权利要求17的方法,其进一步包括自适应地改变关联长度。
22: 一种方法,其包括: 操作包括若干个声频传感器的助听器,声频传感器提供相应数量 的传感器信号; 用助听器选定监测声频激励的方向; 对各传感器信号确定一组信号变换分量; 计算若干个加权值随信号变换分量,调节因子、及方向的相关性 的变化;及 用加权值对信号变换分量进行加权来提供代表发自该方向声频激 励的输出信号。
23: 权利要求22的方法,其中变换分量与不同的频率相对应而调 节因子具有第一频率的第一值和第二频率的第二值来控制束宽,第二 值与第一值不同。
24: 权利要求22的方法,其中调节因子与关联长度相对应而且进 一步包括使用按照调节因子不同数值而自适应改变的关联长度来确定 若干个不同的相关性。
25: 权利要求22的方法,其进一步包括: 确定干扰水平;及 根据干扰水平使用调节因子来调节助听器的束宽。
26: 权利要求22的方法,其进一步包括: 确定至少一个频率的至少一个传感器信号对时间的变化率;及 根据该变化率用调节因子来调节关联长度。
27: 一种方法,其包括: 操作包括若干个声频传感器的助听器,声频传感器提供相应数量 的传感器信号; 对各传感器信号提供一组信号变换分量; 计算若干个加权值随各不同频率变换分量的相关性的变化,所述 计算包括应用第一频率的第一束宽控制值和与第一束宽控制值不同的 第二频率的第二束宽控制值;及 用加权值对信号变换分量进行加权来提供输出信号。
28: 权利要求27的方法,其进一步包括选择第一束宽值和第二束 宽值来在预定的频率范围提供大体上恒定的助听器束宽。
29: 权利要求27的方法,其中第一束宽值和第二束宽值按照第一 频率对第二频率的干扰数量的差别而有所不同。
30: 一种方法,其包括: 操作包括若干个声频传感器的助听器,声频传感器提供相应数量 的传感器信号; 提供传感器信号的第一多个信号变换分量; 计算第一组加权值随对应第一关联长度的第一信号变换分量第一 相关性的变化关系; 提供传感器信号的第二多个信号变换分量; 计算第二组加权值随对应第二关联长度的第二信号变换分量第二 相关性的变化关系,第二关联长度与第一关联长度不同;及 产生输出信号作为第一加权值和第二加权值的函数。
31: 权利要求30的方法,其中第一关联长度和第二关联长度按照 至少一个传感器信号的至少一个频率相对于时间的变化率差别而有所 不同。
32: 权利要求22-31之一的方法,其中传感器的数量是两个,而 助听器输出是单一、非立体声的。
33: 权利要求22-31之一的方法,其中进行所述计算使输出方差 最小。
34: 权利要求22-31之一的方法,其进一步包括对选定的声频源 对基准进行定位作为变换分量的函数。
35: 权利要求22-31之一的方法,其中变换分量为傅氏型式。
36: 一个助听器系统,可操作其实施权利要求22-31之一的方 法。
37: 一种方法,其包括: 用若干个声频传感器检测声频激励,声频传感器提供相应数量的 传感器信号; 对各传感器信号建立一组信号变换分量; 跟踪声源激励相对于基准位置随变换分量的变化关系;及 提供输出信号随位置和变换分量相关性的变化关系。
38: 权利要求37的方法,其中传感器的数量是两个,所述跟踪包 括确定传感器信号之间的相位差。
39: 权利要求37的方法,其中基准是指定的轴线,而位置以方位 角方向的形式提供。
40: 权利要求37的方法,其中所述跟踪包括产生具有若干个元的 数组,每个元对应于一个不同的方位角,并且检测数组元中的一个或 多个峰值。
41: 权利要求37的方法,其进一步包括相对于频率来调节束宽。
42: 权利要求37的方法,其进一步包括计算若干个不同的关联矩 阵和自适应地改变一个或多个矩阵对至少一个其他矩阵的关联长度。
43: 权利要求37的方法,其进一步包括控制相应于位置的方向指 示向量。
44: 权利要求37的方法,其中所述提供包括通过对变换分量进行 加权以减小输出信号方差来产生输出信号以及提供预定的放大倍数。
45: 一种装置,可操作其使用权利要求37-44之一的方法。
46: 一种助听器系统,可操作其使用权利要求37-44之一的方 法。
47: 一种仪器,其包括: 声频传感器阵列,可操作它检测声频激励,所述声频传感器阵列 包括两个或多个声频传感器,可操作各声频传感器提供各自的一个传 感器信号;及 处理器,可操作它对各所述传感器信号确定一组频率分量并且产 生出代表指定方向声频激励的输出信号,所述输出信号根据各传感器 信号的这组频率分量的加权组合进行计算以便减小受指定方向声频激 励放大倍数限制的输出信号的方差。
48: 权利要求47的仪器,其中可操作所述处理器来计算加权组合 通常使输出信号的方差减至最小并使放大倍数保持在单位1。
49: 权利要求47的仪器,其中可操作所述处理器来确定若干个信 号加权随频域关联矩阵和相应于指定方向的向量的变化。
50: 一种仪器,其包括: 第一声频传感器,可操作其提供第一传感器信号; 第二声频传感器,可操作其提供第二传感器信号; 处理器,可操作其产生出代表由第一声频传感器和第二声频传感 器从指定方向上检测到的声频激励的输出信号,所述处理器包括: 把所述第一传感器信号变换成第一若干个频域变换分量和把所述 第二传感器信号变换成第二若干个频域变换分量的装置, 装置用于对所述第一变换分量进行加权提供相应数量的第一加权 分量和对所述第二变换分量进行加权提供相应数量的第二加权分量作 为输出信号方差和指定方向声频激励放大倍数限制的函数, 装置用于将各第一加权分量与相应的一个第二加权分量相组合来 提供频域形式的输出信号;及 根据所述频域形式提供时域形式输出信号的装置。
51: 权利要求47-50之一的仪器,其中所述处理器包括控制指定 方向的装置。
52: 权利要求47-50之一的仪器,其进一步包括至少一个对所说 输出信号响应的声频输出装置。
53: 权利要求47-50之一的仪器,其中所述仪器被安排成助听 器。
54: 权利要求47-50之一的仪器,其中仪器被安排成语音输入装 置。
55: 权利要求47-50之一的仪器,其中可操作所述处理器对声频 激励源相对于基准进行定位。
56: 权利要求47-50中任何权利要求的仪器,其中可操作所述处 理器跟踪声频激励源相对于方位角平面的位置。
57: 权利要求47-50中任何权利要求的仪器,其中可操作所述处 理器用频率来调节束宽控制参数。
58: 权利要求47-50中任何权利要求的仪器,其中可操作所述处 理器计算若干个不同的关联矩阵并且自适应地调节一个或多个矩阵对 至少一个其他矩阵的关联长度。

说明书


干扰抑制技术

    相关申请的相互参照

    本申请为2000.5.10提出的美国专利申请No.09/568,430的后继申请,其涉及到:1998.11.16提出的美国专利申请No.09/193,058,它是1996.6.19提出的美国专利申请No.08/666,757(现为美国专利No.6,222,927B1)的部分后继;2000.5.10提出的美国专利申请No.09/568,435;及2001.3.13提出的美国专利申请No.09/805,233,它是国际专利申请No.PCT/US99/26965的后继,所有这些在此引入作为参考。政府权利

    美国政府拥有对本发明的已缴付专利许可证并且有权在限定情况下要求该专利所有者对按DARPA合同No.ARMY SUNY 240-6762A和国家卫生研究所合同No.R21DC04840规定的合理条款发放专利许可。发明背景

    本发明的目的在于处理声频信号,更具体地说但并不仅仅是涉及到如下技术;使用两个或多个麦克风从选定源引出声频信号同时抑制其他源的干扰。

    在存在干扰信号的情况下引出要求信号的困难是声学工程师遇到的一个长期存在地问题。这个问题影响着许多种装置如语音识别和情报收集系统的设计和制造。使用助听器装置时将要求的声音与不需要的声音分开尤其困难。通常,在要求的声音受附近声源噪声混杂时,助听器装置不可能对要求的声音进行选择性放大。当要求的声音为语音信号而附近的噪声也是其他说话人发出的语音信号时,这个问题就更加严重。按此处使用的情况,“噪声”不仅是指随机或不确定的信号,而且也是指不希望的信号和干扰对要求信号听觉的信号。发明内容

    本发明的一种形式包括使用两个或多个麦克风的独特的信号处理技术。其他形式包括处理声频信号的独特的装置和方法。

    本发明进一步的实施方案,目的,特点,特性,好处,形式,及优点从这里提供的详细附图和说明将会变得显而易见。附图说明

    图1是信号处理系统的示意性视图。

    图2是进一步说明图1系统选定特性的示意图。

    图3是操作图1系统的程序流程图。

    图4和5说明本发明的其他实施方案,其分别相应于图1系统的助听器和计算机语音识别应用。

    图6是图1系统实验装置的示意性视图。

    图7是目标语音信号和两个干扰语音信号的幅度随时间变化的图形。

    图8是处理前图7混合语音信号的幅度与时间关系图形,相应于图7目标语音信号的引出信号,及图7目标语音信号的复制信号供比较。

    图9是按束宽与频率关系对规则化因子(M)值为1.001,1.005,1.01及1.03时的曲线图。

    图10是使用图1系统在有或没有图3程序时能够完成的过程流程图。

    图11和12是说明图10过程效能的图形。具体实施方式

    虽然本发明可以采取多种不同形式,但为了促进对本发明原理的了解,现将参照附图中说明的实施方案,并将使用专门语言对其进行说明。不过将会了解到并不会由此而对本发明范围有所限制。如本发明所涉及本领域熟练技术人员通常会想到的那样,所述实施方案的任何变动和进一步修正,以及如此处所述本发明原理的进一步应用都是可以考虑的。

    图1用图说明了本发明一个实施方案的声频信号处理系统10。形成的系统10,在存在来自其他源如声频源14,16的干扰或噪声的情况下,从声频源12引出要求的声频激励。系统10包括声频传感器20。对于所说明的实例,传感器阵列20包括在源12,14,16的接收范围内的一对声频传感器22,24。安排声频传感器22,24检测来自源12,14,16的声频激励。

    传感器22,24如沿横轴T同样标记线段所画出的其间距离为D。横轴T与方位角轴线AZ相垂直。中点M表示从传感器22至传感器24距离D的中间点。轴线AZ与中点M和声频源12相交。轴线AZ被指定为方位角平面中源12,14,16和传感器22,24的基准点(零度)。对所说明的实施方案,源14,16限定的对轴AZ的方位角14a,16a分别为约+22℃和-65℃。相应地,声频源12相对于轴AZ处在0°。在系统10的一种工作模式中,声频源12与轴AZ的“在轴”准直选择它作为用系统10监测的要求或目标声频激励源。相反,“离轴”源14,16被看作是噪声而用系统10进行抑制,其在后面进行更详细解释。为了调节被监测的方向,可以移动传感器22,24来改变轴线AZ的位置。在另外或其他的工作模式中,如下面更充分说明的那样,通过改变图3程序中包括的方向指示可以调节指定的监测方向。对这些工作模式,当然既不需要移动传感器22也不需要移动传感器24来改变指定的监测方向,同时指定的监测方向也无需与轴线AZ一致。

    在一种实施方案中,传感器22,24为全向动态麦克风。在其他实施方案中,可以使用不同形式的麦克风,如心形线型或双心形线型麦克风,或可以使用本领域熟练技术人员会想到的不同类型的传感器。另外,在可供选择的实施方案中,在不同方位角可能存在或多或少的声频源;其中提供所画出的源12,14,16的数目和排列只是作为诸多实例中的一个例子。在这样的一个实例中,有几组个人参与同时交谈的房间可能提供若干个声源。

    传感器22,24在工作上与处理子系统30耦合来处理其接收到的信号。为便于说明,传感器22,24分别指定为属于左信道L和右信道R。另外,由传感器22,24提供给处理子系统30的模拟时域信号对各自的信道L和R表示成XL(t)和XR(t)。可操作处理子系统30来提供抑制源14,16干扰的输出信号,其有利于从位于沿轴线AZ的选定声频源12所检测到的声频激励。这一输出信号供给至输出装置90,再以可以进一步处理的声音或图像信号的形式提供给使用者。

    另外再参照图2,所提供的示意图说明了系统10的其他细节。处理子系统30包括信号调节器/滤波器32a和32b,对来自传感器22,24的输入信号XL(t)和XR(t)进行滤波和调节;其中t代表时间。经过信号调节器/滤波器32a和32b后,调节过的信号输入到相应的模-数(A/D)转换器34a和34b。分别向信道L和R提供离散信号XL(z)和XR(z);其中z表示离散采样事件。选择采样速率fs来提供感兴趣频率范围所要求的保真度。处理子系统30还包括含处理器42和存储器50的数字电路40。离散信号XL(z)和XR(Z)以先进先出(FIFO)的方式存入存储器50的采样缓冲存储器52。

    处理器42可以是可编程软件或固件装置,状态逻辑器,或可编程和专用硬件的组合。另外,处理器42可以由一个或多个部件组成并可包括一个或多个中央处理器(CPU)。在一种实施方案中,处理器42为特别适于信号处理的数字式可编程、高度集成半导体芯片的形式。在其他实施方案中,处理器42可以是通用型式或本领域熟练技术人员会想到的其他装置。

    同样,存储器50可以按本领域熟练技术人员会想到的各种形式构成。存储器50可以包括一种或多种型式的固态电子存储器,磁存储器,或易失型和/或非易失型光存储器。另外,存储器可以与处理子系统30的一个或多个其他部件集成在一起和/由一个或多个截然不同的部件所组成。

    处理子系统30可以包括任何振荡器,控制时钟,接口,信号调节器,附加滤波器,限幅器,转换器,电源,通信端口,或本领域熟练技术人员为实施本发明而想到的其他型式的部件。在一种实施方案中,子系统30以单个微电子装置的形式提供。

    还参照图3的流程图,来说明程序140。形成数字电路40来完成程序140。处理器42执行至少完成程序140某些运算的逻辑。通过非限制性实例,这一逻辑可以为软件编程指令,硬件,固件,或其组合的形式。该逻辑可以部分或完全地储存在存储器50和/或配置一个或多个其他部件或装置。通过非限制性实例,这一逻辑可以以信号的形式提供给子处理系统30,信号由传输介质诸如计算机网络或其他有线和/或无线通信网络传输。

    在阶段142,如前所述那样,程序140从A/D采样起动开始并将得到的离散输入采样XL(z)和XR(z)存入缓冲存储器52。采样与程序140的其他阶段同时进行,从下述说明其将变得显而易见。程序140从阶段142进行到条件限制144。条件限制144检测程序140是否要继续。如果不继续,程序140就停止。否则的话,程序140就继续至阶段146。条件限制144可能相应于运算器开关,控制信号,或与系统10(未示出)相关联的电源控制。

    在阶段146,根据采样XL(z)和XR(z)的顺序执行快速离散傅立叶变换(FFT)算法并将其存入各自信道L和R的缓冲存储器54来提供相应的频域信号XL(k)和XR(k);其中k是FFT(或者此处所称的“频率接收器(frequency bin)”)的离散频率指数。进行FFT的采样XL(z)和XR(z)组可以根据采样数据的持续时间进行说明。通常,对给定的采样速率fs,各FFT都基于多于100个采样。另外,对阶段146,FFT计算包括对采样数据应用开窗技术。一种实施方案利用汉明窗口。在其他实施方案中,可以没有数据开窗或使用不同的型式,FFT可以根据不同的采样方法,和/或使用本领域熟练技术人员会想到的不同变换。变换后,得到的谱XL(k)和XR(k)存入存储器50的FFT缓冲存储器54。这些谱通常都是复数值。

    已经发现,在要求方向上的信号以预定放大倍数输出的限制条件下,以把所得输出信号的方差(或等效地能量)减至最小的方式,通过对输入信号进行加权和求和能够改善发自要求方向上声频激励的接收情况。下述关系式(1)表示出频域输入信号的这种线性组合:Y(k)=WL*(k)XL(k)+WR*(k)XR(k)=WH(k)X(k);---(1)]]>其中:W(k)=WL(k)WR(k);---X(k)=XL(k)XR(k);]]>Y(k)是以频域形式表示的输出信号,WL(k)和WR(k)是相应于信道L和R在各频率k下的复数值乘数(加权),上标“*”表示复数共轭运算,而上标“H”表示取厄米共扼向量。对这一方法,希望确定最佳一组加权WL(k)和WR(k),以使Y(k)的方差减至最小。使方差最小通常导致与要求方向不一致的源的抵消。对要求方向是沿轴线AZ的工作模式来说,不发至阵列正前方的频率分量受到的衰减,因为它们通过左和右信道L,R时在相位上是不一致的,因此方差要比正前方源的方差要大。这种情况下使方差最小相当于使离轴源的输出功率最小,如下述关系式(2)的最佳化目标所说明的关系:MWinE{|Y(k)|2}---(2)]]>其中Y(k)是对关系式(1)所说明的输出信号。在一种形式中,限制条件要求发自沿轴线AZ源的“在轴”声频信号以如下关系式(3)规定的单位放大倍数通过:

              eHW(k)=1                (3)这里e是相应于要求方向的二元向量。当这个方向与轴线AZ一致时,传感器22和24通常在同一时刻和同样幅度接收到信号,因此,对所说明实施方案的源12来说,向量e为具有相等加权元的实数值-例如eH=〔0.5,0.5〕。相反,如果选定的声频源不在轴线AZ上,那么可以移动传感器22,24使轴线AZ与其对齐。

    在另外或其他的工作模式中,可以选择向量e的元沿与轴线AZ不一致的要求方向进行监测。对这种工作模式来说,向量e变成复数值,代表对应于离轴AZ声频激励的传感器22,24之间的相应时间/相位延迟。这样,向量e的运算就按前面说明的方向指示进行。相应地,可以安排可供选择的其他方案通过建立对轴线AZ的不同的几何关系来选定要求的声频激励源。例如,监测要求源的方向可以置于对轴线AZ的非零方位角上。的确,通过改变向量e,监测方向可以从一个方向转向另一个方向而无需移动传感器22,24。下面有关图10流程图所说明的过程520提供了定位/跟踪程序的实例,可以将其与程序140结合起来使用来控制向量e。

    对通常与平稳随机过程(其为短时间周期语音信号的特征)相对应的输入信号XL(k)的XR(k),根据关系式(2)和(3)可以确定如下加权向量W(k)的关系式(4):W(k)=R(k)-1eeHR(k)-1e---(4)]]>其中e是与要求接收方向相关联的向量,R(k)是kth频率下的关联矩阵,W(k)是kth频率下的最佳加权向量,而上标“-1”则表示矩阵逆。这一关系的推导结合本发明的通用模型进行了说明,该模型可应用于阵列20中有多于两个传感器22,24的实施方案。

    根据通过对相关时间间隔计算的“F”个快速离散傅立叶变换(FFT)所得到的谱数据可以估算出关联矩阵R(k)。对两信道L,R的实施方案,kth频率下的关联矩阵R(k)可以用如下关系式(5)表示:R(k)=MFΣn=1FXl*(n,k)Xl(n,k)1FΣn=1FXl*(n,k)Xr(n,k)1FΣn=1FXr*(n,k)Xl(n,k)MFΣn=1FXr*(n,k)Xr(n,k)=Xll(k)Xlr(k)Xrl(k)Xrr(k)---(5)]]>其中XR是左信道L频率缓冲存储器中的FFT,XT是右信道R频率缓冲存储器中的FFT,它们都是从根据更早些时候执行阶段146时计算的、先前储存的FFT得到的;“n”是用于该计算之FFT个数“F”的指数;及“M”是规则化参数。为表达简洁,项Xll(k),Xlr(k),Xrl(k),及Xrr(k)代表加权和。应当理解到R(k)矩阵的元是非线性的,因此Y(k)为输入的非线性函数。

    因而,在阶段148,先前存入缓冲存储器54的谱Xl(k)和Xr(k)按先进先出(FIFO)的顺序从存储器50读出。程序140然后进行到阶段150。在阶段150,乘数加权WL(k),WR(k)根据各频率k下的关系式(1)分别应用到Xl(k)和Xr(k)从而提供输出谱Y(k)。程序140继续到阶段152,其进行逆快速傅立叶变换(IFFT)把阶段150中确定的Y(k)FFT改变成离散时域形式表示的y(z)。接着,在阶段154,用D/A转换器84(图2)进行数-模(D/A)转换从而提供模拟输出信号y(t)。当然,Y(k)FFT与输出采样y(z)之间的对应关系可以改变。在一个实施方案中,对每个y(z)都有一个Y(k)FFT输出,从而提供了一一对应的关系。在另一实施方案中,对每16个要求的输出采样y(z)可能有一个Y(k)FFT,在这种情况下,额外的采样可从已有的Y(k)FFT得到。在其他实施方案中,可以建立不同的对应关系。

    在转换至连续时域形式以后,将信号y(t)输入到信号调节器/滤波器86。调节器/滤波器86将调节过的信号提供给输出装置90。如图所说明的,输出装置90包括放大器92和声音输出装置94。装置94可以是扬声器,助听器接收器输出,或本领域熟练技术人员会想到的其他装置。应当理解到系统10对立体声输入进行处理产生出非立体声输出。在有些实施方案中,可对这一输出进一步处理以提供多种输出。在一个助听器应用实例中,提供两个输出,其通常向使用者每只耳朵传递同样的声音。在另一助听器应用中,提供给每只耳朵的声音在强度和/或时间上有选择性区别,说明了声源对各传感器22,24在方向上的差别,从而改善了对声音的感觉。

    在阶段154之后,程序140继续到条件限制156。在许多应用中,可能不希望重新计算对每个Y(k)的加权向量W(k)的元。因此,条件限制156要测试出从向量W(k)上次计算以来是否已过去了要求的时间间隔。如果这一时间周期尚未过去,那么控制就流向阶段158使缓冲存储器52,54移位以对下一组信号进行处理。从阶段158,处理循环160结束,并返回到条件限制144。只要条件限制144保持成立,就对下一组xL(z)和xR(z)采样重复阶段146来确定下一对XL(k)FFT和XR(k)FFT用以存入缓冲存储器54。另外,每次执行处理循环160时,都要重复阶段148,150,152,154来处理先前存入的XL(k)FFT和XR(k)FFT,从而确定下一个Y(k)FFT并相应地产生出连续的y(t)。这样,缓冲存储器52,54就在阶段158中随着循环160的每次重复而周期性地移位直至如条件限制144所测试的那样,程序140停止或者是条件限制156的时间周期已经过去。

    如果条件限制156的测试结果成立,那么程序140就从条件限制156的肯定分支前进,在阶段162中按照关系式(5)来计算关联矩阵R(k)。根据这个新的关联矩阵R(k),在阶段164中按照关系式(4)来确定修改的向量W(k)。从阶段164,修正循环170继续到先前说明的阶段158,再重新进入处理循环160直至程序140按条件限制144停止或向量W(k)的另一重新计算时间来临。注意,条件限制156中测试的时间周期可以按照循环160的重复次数,修正之间产生的FFT或采样数,等进行测量。另一方面,修正之间的周期可以根据来自运算器或监测装置(未示出)的反馈进行动态调整。

    在最初起动程序140时,通常得不到较早存入的数据。因此,在缓冲存储器52,54中可以存入适当的种子值以支持初始处理。在其他实施方案中,阵列20中可以包括更多数目的声频传感器,程序140也可相应地调整。对这种更一般的形式,输出可以用关系式(6)表示如下:

              Y(k)=WH(k)X(k)              (6)其中X(k)为一向量,其记入了“c”个输入信道,加权向量W(k)具有同样的量纲。方程(6)与方程(1)一样,但各向量的量纲是c而不是2。输出功率可以用关系式(7)表示如下:

       E[Y(k)2]=E[W(k)HX(k)XH(k)W(k)]=W(k)HR(k)W(k)    (7)其中关联矩阵R(k)与“c×c”的量纲一致。向量e为转向向量,其说明与要求监测方向相关联的加权和延迟,并且具有下述关系式(8)和(9)所提供的形式:e(φ)=1C1e+jφk......e+j(C-1)φkT---(8)]]>φ=(2πDfs/(cN))(sin(θ))其中k=0,1,...,N-1    (9)其中C是矩阵元数,c是以米/秒表示的声音速度,θ是要求的“查看方向”。这样,向量e可以随频率改变以改变要求的监测方向或查看方向并相应地控制阵列方向。在如关系式(3)所说明的关于向量e的同样条件限制下,这一问题用关系式(10)可概括如下:

        使最小化{W(k)HR(k)W(k)}

           W(k)                                     (10)

           这样eHW(k)=1这个问题使用拉格朗日乘法可以解决,通常其特征用关系式(11)表示如下:

    使最小化{成本函数+λ*限制条件}            (11)

        W(k)其中成本函数是输出功率,而限制条件如上述对向量e所列。向量通解从关系式(12)拉格朗日乘法函数H(w)开始:H(W)=12W(k)HR(k)W(k)+λ(eHW(k)-1)---(12)]]>其中引入二分之一(1/2)因子是为了简化后面的数学运算。将H(w)对W(k)取梯度,并将这个结果置于等于零,得到关系式(13)如下:

          wH(W)=R(k)W(k)+eλ=0              (13)另外,其后的关系式(14)为:

          W(k)=-R(k)-1eλ                      (14)将这个结果用到下面的限制条件方程关系式(15)和(16):eH[-R(k)-1eλ]=1---(15)]]>

          λ=-[eHR(k)-1e]-1                 (16)然后使用关系式(14),最佳加权如关系式(17)示出:

          Wopt=R(k)-1e[eHR(k)-1e]-1       (17)因为括号内的项为标量,关系式(4)的这项在分母上,因此其是相等的。

    为清晰起见,再回到两个变量的情况,将加权和并入项Xll,Xlr,Xrl和Xrr可以更简洁地表示关系式(5),然后它们按关系式(18)重新命名为关联矩阵R(k)的组成部分:R(k)=Xll(k)Xlr(k)Xrl(k)Xrr(k)=R11R12R21R22---(18)]]>其倒数可以用关系式(19)表示成:R(k)-1=R22-R12-R21R11*1det(R(k))---(19)]]>其中det()是行列式算符。如果要求的监测方向与传感器阵列垂直,e=〔0.5,0.5〕T,那么关系式(4)的分子就可以用关系式(20)表示为:R(k)-1e=R22-R12-R21R110.50.5*1det(R(k))=R22-R12R11-R21*0.5det(R(k))---(20)]]>使用以前的结果,分母用关系式(21)表示为:eHR(k)-1e=0.50.5*R22-R12R11-R21*1det(R(k))=(R11+R22-R12-R21)*0.5det(R(k))---(21)]]>消去行列式的公因子,简化后的关系式(22)就成为:w1w2=1(R11+R22-R12-R21)*R22-R12R11-R21---(22)]]>它还可以按两个信道间相关性之和的平均值以关系式(23)表示成:w1(k)wr(k)=1(Xll(k)+Xrr(k)-Xlr(k)-Xrl(k))*Xrr(k)-Xlr(k)Xll(k)-Xrl(k)---(23)]]>其中w1(k)和wr(k)分别为对kth频率下,左和右信道所要求的加权,而关联矩阵的组成部分现在则用关系式(24)表示为:Xll(k)=MFΣn=1FXl*(n,k)Xl(n,k)]]>Xlr(k)=1FΣn=1FXl*(n,k)Xr(n,k)]]>(24)Xrl(k)=1FΣn=1FXr*(n,k)Xl(n,k)]]>Xrr(k)=MFΣn=1FXr*(n,k)Xr(n,k)]]>这与关系式(5)中的情况一样。这样,在计算平均和(其可能保持为连续平均)以后,对两信道实施方案的计算量可以减少。

    在程序140的进一步变型中,在阵列20的传感器间放大倍数差可忽略的应用中,可以使用改进的方法。对这种方法,利用了附加的限制条件。对具有固定在轴转向方向和传感器间放大倍数差可忽略的双传感器装置来说,要求的加权满足如下关系式(25):Re[w1]=Re[w2]=12---(25)]]>对这一可供选择方法的方差最小化目标和单位放大倍数限制条件分别相应于下述关系式(26)和(27):MinWkE{|Yk|2}---(26)]]>eH12+Im[w1]12+Im[w2]=1---(27)]]>通过检查,当eH=〔11〕时,关系式(27)化简为关系式(28)如下:

             Im[w1]=-Im[w2]                  (28)求解受关系式(27)中条件限制的要求的加权,并使用关系式(28)则得出如下关系式(29):Wopt=1/21/2+jIm[R12]-Im[R12]·12Re[R12]-R11-R22---(29)]]>

    可以使用根据关系式(29)确定的加权来取代用关系式(20),(23),和(24)确定的加权;其中R11,R12,R21,R22与对关系式(18)所说明的那些一样。在适当条件下,这种替换通常提供出与更有效计算可比较的结果。在利用关系式(29)时,通常希望目标语音或其他声频信号来源于在轴方向,而且传感器要彼此匹配或者补偿传感器间的放大倍数差别。另一方面,可以利用各频带中关于感兴趣源的定位信息结合关系式(29)的计算法来控制传感器阵列20的方向。这一信息可以按照过程520提供,后面结合图10的流程图将对该过程进行更充分地说明。

    参照关系式(5),规则化因子M通常略大于1.00以便在关联矩阵R(k)是或接近是奇异矩阵,因而是不可逆矩阵的情况下限制加权的大小。例如,当时域输入信号对F个连续的FFT计算是完全相同的时候,就出现这种情况。已经发现,这种形式的规则化通过减少或消除对时域射束形成器所共有的过程制造物还可以改善所感受的声音质量。

    在一种实施方案中,规则化因子M为常数。在其他实施方案中,可以使用规则化因子M来调节或控制阵列的束宽,或角度范围,在此束宽或角度范围某一特定频率的声音冲击到相当于轴线AZ的阵列上并通过程序140进行处理而又没有大的衰减。这一束宽通常在低频时要比在高频时大,其可以用下述关系式(30)表示:r=1-M,其中M是规则化因子,如关系式(5)中一样,c代表声速以米/秒(m/s)表示,f代表频率以赫兹(Hz)表示,D是麦克风之间的距离以米(m)表示。对关系式(30),束宽-3dB定义的束宽是它把感兴趣的信号衰减了相当于小于或等于三分贝(dB)的数量。当然,在本发明的其他实施方案中可以选择不同的衰减阈值来限定束宽。图9按束宽对频率的关系,提供分别代表规则化因子M的恒定值为1.001,1.005,1.01和1.03的四条不同形状的曲线图。

    按关系式(30),随着频率的增加,束宽减小;而随规则化因子M的增加,束宽增加。因此,在程序140的一种可选择的实施方案中,规则化因子M随频率变化增加,在要求的频率范围提供出更均匀的束宽。在程序140的另一实施方案中,M又随时间的变化而改变。例如,如果在一定频带内的输入信号中几乎不存在干扰的话,那么在这些频带中,规则化因子M就可以增加。已经发现,在干扰低或干扰频带内束宽的增加通过限制关系式(22),(23),和/或(29)中使用的加权的大小,通常提供出比较好的主观音质。在另一变型中,通过在含有选定阈值以上干扰的频带减小规则化因子M可以补充这一改进。已经发现,这种减小通常提供更精确的滤波,并更好地消除干扰。在又一实施方案中,规则化因子M依照基于频带特有干扰的适配函数而改变。在其他的实施方案中,规则化因子M依照本领域熟练技术人员会想到的一种或多种其他关系的而改变。

    参照图4,以助听器系统210说明了本发明各种不同实施方案的一种应用;其中同样的参考数字表示同样的部件。在一个实施方案中,系统210包括眼镜G和声频传感器22及24。声频传感器22和24固定在本实施方案中的眼镜G上并且彼此分开,而在工作上与处理器30相连接。处理器30在工作上与输出装置190连接。输出装置190为助听器耳机的形式且置于使用者耳朵E内的提供相应的声音信号。对系统210来说,构成处理器30来完成程序140或其变型,其输出信号y(z)提供给输出装置190而不是图2的输出装置90。如前面所讨论的,附加输出装置190可以与处理器30连接向另一只耳朵(未示出)提供声音。这一装置如通常处在传感器22和24中间用同样标记的十字准线所表示的那样,将轴线AZ限定在与图4的观察平面相垂直。

    使用时,佩戴眼镜G的使用者通过把相应的源对准指定的方向,如轴线AZ,可以有选择地接收声频信号。因此,其他方向的源就受到衰减。另外,佩戴者通过把轴线AZ再重对准另一要求的声源就可以选择不同的信号并相应地抑制了不同的一组的离轴源。其他或另外地,可以形成系统210适用于与轴线AZ不相一致的接收方向。

    处理器30和输出装置190可以是分开的单元(如所说明的)或包括在耳朵里佩戴的一个公共单元内。处理器30和输出装置190间的耦合可以是电线或无线传输。在一种可供选择的实施方案中,传感器22,24和处理器30彼此相互远距离放置形成,通过射频传输向位于耳朵E内的一个或多个输出装置190播放。

    在另一助听器实施方案中,传感器22,24做成适合于收听者耳朵的大小和形状,并且调节处理器的算法来计算出由头部,驱干,及耳廓造成的盲区。通过推导出针对收听者的头部相关传递函数(HRTF)或根据使用本领域熟练技术人员所熟知技术的平均人口就可以不提供这种调节。然后使用这个函数来提供补偿盲区输出信号的适当加权。

    另一个助听器系统实施方案是基于蜗形植入件。蜗形植入件通常置于使用者中耳道内,并且成形以便以标准方式沿中耳提供电激励信号。植入件可以包括按照本发明讲授内容工作的处理子系统30的某些部分或全部。其他或另外,一个或多个外部组件包括子系统30的某些部分或全部。通常与基于蜗形植入件的助听器系统相关联的传感器阵列为外部佩戴,其安排成通过导线,电线和/或使用无线技术与植入件进行通信。

    除了各种不同形式的助听器以外,本发明还应用于其他形式。例如,图5示出使用本发明的语音输入装置310,其作为个人计算机C语音识别程序的前端语音增强装置;其中同样的参考数字表示同样的部件。装置310包括按预定关系彼此分开的声频传感器22,24。传感器22,24在工作上与计算机C内的处理器330连接。处理器330通过扬声器349a、349b和/或图像显示器396提供供内部使用的输出信号或应答;及安排成按照程序140或其变型对来自传感器22,24的语音输入进行处理。在一种工作模式中,计算机C的用户对准预定轴线将语音输入传送给装置310。在另一种工作模式中,装置310根据来自运算器的反馈来改变其监测方向和/或根据在选定时间周期内最强声源的位置来自动地选择监测方向。其他或另外,可以利用如图10流程图中说明的、由过程520提供的源定位/跟踪能力。在另一语音输入应用中,利用本发明的方向可选语音处理部件来提高免提电话,声音监听装置,或其他声音系统的性能。

    在一定条件下,传感器阵列相对于目标声频源的方向定向会改变。不用说明这些改变,也可以得出目标信号的衰减。例如,在立体声助听器佩戴者转动他或她的头部使他或她不与目标源完全对准时,就会出现这种情况,同时助听器也不用别的办法说明这一偏差。已经发现,通过对一个或多个感兴趣声频源的定位和/或跟踪可以减小因偏差而引起的衰减。图10流程图说明相对于参考源对要求声频源进行跟踪和/或定位的过程520。过程520可以用于助听器或其他应用中如语音输入装置,免提电话,声音监听设备,等等-或者结合前述实施方案一起使用或不受前述实施方案限制而单独使用。根据用图1系统10的实施情况对过程520说明如下。对这一实施方案,处理系统30可以适当包括执行过程520的一个阶段或多个阶段和/或条件限制的逻辑。在其他实施方案中,如本领域熟练技术人员会想到的那样,可以使用不同的装置来实施过程520。

    过程520以像程序140阶段142中所说明的方式从阶段522中的A/D转换开始。从阶段522,过程520继续到阶段524,对从阶段522得到的数字式数据进行变换,这样就提供“G”个FFT,而每个FFT又有“N”个FFT频率接收器。阶段522和524可以以行进的方式执行,将结果进行周期性的寄存供过程520的其他运算以并行的,流水线的,按特定顺序的,或本领域熟练技术人员会想到的不同方式在稍后时进行访问。利用阶段524的FFT,一系列定位结果P(γ)可以按照关系式(31-35)说明如下:P(γ)=Σg=1G(Σk=0N/2-1Σnd(θx)),---(31)]]>γ=[-90°,-89°,-88°,......,89°,90°]n=[0,...,INT(D·fsc)]---(32)]]>d(θx)=1,θx∈γand

           |x(g,k)|≤1 and

           |L(g,k)|+|R(g,k)|≥Mthr(k)    (33)=0,θx∉γor]]>

           |x(g,k)|>1 or

           |L(g,k)|+|R(g,k)|<Mthr(k)θx=ROUND(sin-1(x(g,k)))                 (34)x(g,k)=N·c2π·k·fs·D(∠L(g,k)-∠R(g,k)±2πn)---(35)]]>其中算符“INT”返回其运算数的整数部分,L(g,k)和R(g,k)分别为对gthFFT之kthFFT频率接收器的信道L和R的频域数据,Mthr(k)是FFT频率接收器k中频域数据的阈值,算符“ROUND”返回其运算的最近的整数度数,c是音速以米/秒表示,fs是采样速率以赫兹表示,以及D是阵列20的两个传感器间的距离(以米表示)。对这些关系式来说,数组P(γ)用181个方位角位置元限定,这些位置元对应于增量为1°从-90°-+90°的方向。在其他实施方案中,可以使用不同的分辨率和/或位置指示技术。

    从阶段524,过程520继续到指数初始化阶段526,在这一阶段中,G个FFT的指数g和每个FFT的N个频率接收器的指数k分别设置在1和零(g=1,k=0)。从阶段526,过程520通过进入频率接收器处理循环530和FFT处理循环540来继续。对这一实例来说,循环530被套在循环540里边。循环530和540从阶段532开始。

    对离轴声频源而言,相应的信号行进不同的距离到达阵列20的各传感器22,24。通常,这些不同距离在某一频率下造成信道L和R间的相位差。在阶段532,程序520对FFTg的当前频率接收器k确定了信道L和R之间的相位差,将此相位差转换成距离差,并依照关系式(35)确定这一距离差与传感器间隔D的比率x(g,k)。依照关系式(34),使用比率x(g,k)求出信号到达角度θx,并舍入至最近的度数。

    接着遇到条件限制534要检查信道L和R中的信号能量水平是否大于阈值能量水平Mthr以及x(g,k)值是否是可以计算有效到达角的数值。如果两个条件都满足的话,那么在阶段535将数值1加到P(γ)的相应元上,其中γ=θx。过程520从阶段535前进到条件限制536。如果条件限制534的两个条件都不满足,那么对P(γ)不加修正,过程520越过阶段535,继续到条件限制536。

    条件限制536要检查是否所有的频率接收器都处理过,亦即是否指数k等于接收器的总数N。如果不是(条件限制536是否定的),过程520则继续到阶段537,在该阶段中指数k增加了1(k=k+1)。从阶段537,循环530结束,进而返回到阶段532来处理新的g和k的组合。如果条件限制536的检查结果是肯定的,那么接着遇到条件限制542,其检查是否所有的FFT都已经处理,亦即指数g是否等于FFT的G数。如果不是(条件限制542是否定的)过程520则继续到阶段544使g增加1(g=g+1)并使k回零(k=0)。从阶段544,循环540结束,从而返回到阶段532来处理新的g和k的组合。如果条件限制542的检查结果是肯定的,那么对各个G个FFT的所有N个接收器都已处理,因而退出循环530和540。

    利用循环530和540处理的结果,数组P(γ)的元提供了声频源与已知方向(在这种情况下为方位角)相对应的可能性的测量方法。通过检查P(γ),得到了在某一时刻声频源空间分布的估算结果。从循环530,540,过程520继续到阶段550。

    在阶段550,具有最大相对值或“峰”的数组P(γ)的元按照关系式(36)判别如下:

            p(l)=PEAKS(P(γ),γlim,Phtr)          (36)其中P(1)是γ值在±γlim(γlim的典型数值为10°,不过这种情况可能变化很大)之间时函数P(γ)中1ht峰的方向,而且对此方向,峰值都高于阈值Pthr。关系式(36)的PEAKS运算可以使用若干找峰算法来确定数据的最大值,包括选择性地修匀数据和其他运算。

    从阶段550,过程520继续到阶段552,在此阶段选择一个或多个峰。在跟踪最初在轴上的源时,最靠近在轴方向的峰通常相应于要求的源。根据如下关系式(37)可进行这个最靠近峰的选择:θtar=minl|p(l)|---(37)]]>其中θtar是所选峰的方向角。与选择准则无关,过程520继续进行到阶段554来应用选定的一个峰或一些峰。过程520从阶段554继续到条件限制560。条件限制560检查过程520是将继续还是不继续。如果条件限制560的检查结果成立。过程520的循环返回到阶段522。如果条件限制560的检查结果为错误,则过程520停止。

    在与程序140有关的应用中,选定最靠近轴线AZ的峰,并利用它通过调整转向向量e来控制阵列20。在这一应用中,对各频率接收器k进行向量e的修正使其对应于最靠近的峰方向θtar。对转向方向θtar,向量e可以用下述关系式(38)表示,其为关系式(8)和(9)的简化形式:

      e=[1e+jφk]rφ=(2π·D·fsc·N·sin(θtar))---(38)]]>其中k是FFT频率接收器号码,D是传感器22和24之间以米表示的距离,fs是采样频率以赫兹表示,c是音速以米/秒表示,N是FFT频率接收器的数目,而θtar是从关系式(37)得到的。对程序140来说,可以将关系式(38)的修正过的转向向量e代入到程序140的关系式(4)来引出发自方向θtar的信号。同样,过程520可以与程序140结合在一起使用同样的FFT数据来完成定位。换句话说,可以使用阶段142的A/D转换为通过程序140和过程520进行的随后处理提供数字化数据。其他或另外,可以使用对程序140得到的一些或全部FFT来为过程520提供G个FFT。另外,在有或没有程序140的各种不同应用中,束宽修正可以与过程520结合起来。在其他实施方案中,在有或没有程序140时,指明的执行循环530和540至少可以部分地同时进行。

    在另外一实施方案中,除了或者作为替换在前面说明的本发明一种或多种形式中的傅立叶变换外,还使用一种或多种变换技术。一个实例是小波变换,它在数学上将时域波形分解成许多简单波形,这些波形在形状上可能变化很大。通常小波基础函数形成形状类似呈对数间隔频率的信号。在频率增加时,基础函数持续时间随频率的例数而变短。如傅立叶变换一样,小波变换代表具有保持幅度和相位信息几个不同分量的处理过的信号。因而,程序140和/或程序520能适合于使用这类其他或另外的变换技术。一般来说,除了或代替FFT以外,提供关于输入信号不同部分的幅度和/或相位信息并且具有相应逆变换的任何信号变换分量都可以使用。

    前面说明的程序140及其变型一般来说适应信号变化比常规时域迭代适应方案更快。在输入信号在短时段内迅速变化的某些应用中,可能希望对这些变化更敏感。对这些应用,与关联矩阵R(k)相关联的FFT的F数可以提供更理想的结果,即使它并不是对所有信号(或者是指定的关联长度F)都是恒定不变的。一般来说,关联长度F较小对快变化输入信号最好,而关联长度F较大时对慢变化输入信号最好。

    变化的关联长度F可以用多种方式实现。在一个实例中,使用储存在相关缓冲存储器中的不同部分的频域数据来确定滤波器加权。对按得到数据的时间顺序(先进先出(FIFO)储存)的缓冲存储器储存来说,相关缓冲存储器的第一半包含从第一半必要的时间间隔得到的数据。而缓冲存储器的第二半包含从这一时间间隔第二半得到的数据。因此,根据关系式(39)和(40)对每半缓冲存储器可确定关联矩阵R1(k)和R2(k)如下:R1(k)=2MFΣn=1F2Xl*(n,k)Xl(n,k)2FΣn=1F2Xl*(n,k)Xr(n,k)2FΣn=1F2Xr*(n,k)Xl(n,k)2MFΣn=1F2Xr*(n,k)Xr(n,k)]]>(39)R2(k)=2MFΣn=F2+1FXl*(n,k)Xl(n,k)2FΣn=F2+1FXl*(n,k)Xr(n,k)2FΣn=F2+1FXr*(n,k)Xl(n,k)2MFΣn=F2+1FXr*(n,k)Xr(n,k)---(40)]]>通过将关联矩阵R1(k)和R2(k)求和可以得到R(k)。

    使用程序140的关系式(4),使用R1(k)和R2(k)可以得到滤波器系数(加权)。如果对R1(k)和R2(k)间某一频带k加权的差别很大,那么在信号统计中就会指示出很大的变化。通过确定一个加权的幅度和相位变化来检查该加权中的变化就能够对这种变化定量,然后在函数中使用这些量来选择适当的关联长度F。根据关系式(41)对幅度差限定如下:

           ΔM(k)=||w1,1(k)|-|w1,2(k)||    (41)其中w1,1(k)和w1,2(k)分别是使用R1(k)和R2(k)对左信道计算的加权。根据关系式(42)限定角度差如下:

           ΔA(k)=|min(a1-∠wL2(k),a2-∠wL2(k),a3-∠wL2(k))| 

                                 a1=∠wL1(k)                  (42)

                               a2=∠wL1(k)+2π

                               a3=∠wL1(k)-2π其中引入因子±2π以便在角度之一的相位中有±2π转移的情况下提供实际的相位差。

    对某一频率接收器k的关联长度F现在表示成F(k)。一个函数实例由下述关系式(43)给出:

    F(k)=max(b(k)·ΔA(k)+d(k)·ΔM(k)+cmax(k),cmin(k))    (43)其中cmin(k)代表最小关联长度,cmax(k)代表最大关联长度,b(k)和d(k)为负的常数,所有上述都是对kht频带的。因此,在ΔA(k)和ΔM(k)增加时,表明数据有变化,函数的输出就减小。恰当地选择b(k)和d(k),将F(k)限制在cmin(k)与cmax(k)之间,这就能使关联长度只能够在预定的范围内改变。另外还应了解到,F(k)可以呈不同的形式,如非线性函数或输入信号其他量度的函数。

    对每个频率接收器k都得到函数F(k)的值。这种情况是可能的:可以使用少量的关联长度,所以在各频率接收器k中使用最接近F1(k)的关联长度来形成R(k)。使用关系式(44)求出这一最近值如下:imin=mini(|F1(k)-c(i)|),c(i)=[cmin,c2,c3,...,cmax],F(k)=c(imin)]]>(44)其中imin是最小化函数F(k)的指数,c(i)是可能的该组关联长度值,范围在cmin至cmax。

    关于关系式(39)-(44)所说明的自适应关联长度方法可以结合到关联矩阵阶段162和加权确定阶段164,用于助听器如关于图4说明的助听器,或其他应用如监听设备,语音识别系统,及免提电话,仅举此几例。可以适当调节处理子系统30的逻辑线路来保证这种结合。自适应关联长度方法可以有选择地与关系式(29)的方法一起用于加权计算,有关关系式(30)和图9所说明的动态束宽规则化因子的偏差,定位/跟踪过程520,可供选择的其他变换实施方案,和/或本领域熟练技术人员会想到的这类不同的实施方案或程序140的变型。自适应关联长度的应用可以是算符选定和/或如本领域熟练技术人员会想到的根据一个或多个测得的参数而自动地加以应用。

    展望了本发明的许多其他进一步的实施方案。一个进一步的实施方案包括:使用提供若干传感器信号的若干个声频传感器来检测声频激励;对各传感器信号建立一组频率分量;及确定代表来自指定方向声频激励的输出信号。这一确定包括对各传感器信号的频率分量组进行加权以减小输出信号的方差并对来自指定方向的声频激励提供预定的放大倍数。

    在另一实施方案中,助听器包括在存在多个声频源的情况下的若干个声频传感器,其提供相应数量的传感器信号。对声频源中选定的一个源进行监测。产生代表该选定声频源的输出信号。这个输出信号是传感器信号的加权组合,对其进行计算使输出信号的方差最小。

    又一个实施方案包括:操作语音输入装置,其包括提供相应数量传感器信号的若干个声频传感器;确定各传感器信号的一组频率分量;及产生出代表指定方向声频激励的输出信号。这个输出信号是各传感器信号该组频率分量的加权组合,对其进行计算使输出信号的方差最小。

    另外一个实施方案包括一个声频传感器阵列,可操作它来检测包括两个或多个声频传感器的声频激励,而操作每个传感器又可提供若干个传感器信号中一个相应的信号。还包括一个处理器来确定各传感器信号的一组频率分量并产生出代表指定方向上声频激励的输出信号。根据各传感器信号该组频率分量的加权组合对这个输出信号进行计算以减小受指定方向声频激励放大倍数限制的输出信号的方差。

    另一个实施方案包括:使用若干个提供相应数量信号的声频传感器来检测声频激励;对这些信号中的各信号建立若干个信号变换分量;及确定代表指定方向声频激励的输出信号。信号变换分量可以是频域型的。其他或另外,确定输出信号可包括对分量进行加权以减小输出信号的方差并对指定方向声频激励提供预定的放大倍数。

    在另一实施方案中,操作的助听器包括若干个声频传感器。这些传感器提供相应的传感器信号。选定一个方向用助听器对声频激励进行监测。确定各传感器信号的一组信号变换分量并且计算若干个加权值,随这些分量,调节因子,及选定方向的相关性的变化。使用这些加权值对信号变换分量进行加权以提供代表指定方向所发出的声频激励的输出信号。调节因子可以针对关联长度或束宽控制参数,仅举几例。

    对另一实施方案,操作的助听器包括若干个提供相应数量传感器信号的声频传感器。对各传感器信号提供一组信号变换分量并且计算若干个加权值随各不同频率下变换分量相关性的变化。这一计算包括应用第一频率的第一束宽控制值和与第一数值不同的第二频率的第二束宽控制值。信号变换分量用加权值进行加权来提供输出信号。

    对又一实施方案,助听器的声频传感器提供由多个信号变换分量代表的相应的信号。计算第一组加权值随对应于第一关联长度分量中第一多个分量的第一相关性的变化。计算第二组加权值随对应于第二关联长度分量中第二多个分量的第二相关性的变化,第二关联长度与第一关联长度不同。产生出输出信号作为第一和第二加权值的函数。

    在另一实施方案中,使用若干个提供相应数量传感器信号的传感器对声频激励进行检测。对这些信号中的每个信号确定一组信号变换分量。至少定位一个声频作为变换分量的函数。在这一实施方案的一种形式中,相对于基准可以跟踪一个或多个声频源的位置。其他或另外,可以提供输出信号作为声频源位置的函数,声频源通过定位和/或跟踪,以及变换分量的相关性加以确定。

    可以预期,各种不同流向的运算器、转换器、功能块、发生器、单元、阶段,过程,以及技术如本领域熟练技术人员会想到的那样可以改变,重新安排,替代,删除,复制,结合或相加而又不偏离本发明的构思。当然,任何程序,过程,或其变型的运算都可以同时,以流水线方式,以特定顺序,按适合于这些运算彼此相互关联的上述方式的综合,或以本领域熟练技术人员会想到的方式来执行。通过非限制性实例,A/D转换,D/A转换,FFT生成,及FFT反演通常可在其他运算正在执行的同时来完成。这些其他运算可能是针对处理以前存入的A/D或信号变换分量,如阶段150,162,164,532,535,550,552及554,仅列出几种可能。在另一非限制性实例中,基于当前输入信号的加权计算至少可以覆盖先前确定的加权对将要输出信号的应用。本技术说明中列举的所有出版物和专利申请在此引入作为参考就如同各单独出版物或专利申请专门或单独指出而引入作为参考一样。

    实验部分

    下面的实验结果提供了非限制性实例,但其不应当看成是对本发明范围的限制。

    图6说明了测试本发明的实验装置。用实际记录的语音信号已经对算法进行了测试,这些语音信号是通过相对于无回音室内接收麦克风处在不同空间位置的扬声器播放的。麦克风间距D为15cm的一对麦克风422,424(Sennheiser MKE 2-60)设置在听力室内用作为传感器22,24。各种不同的扬声器放在距对应于不同方位角的麦克风422,424的中点M约3处。一个扬声器设置在与轴线AZ相交播放目标语音信号(相应于图2的源12)的麦克风前面。使用几个扬声器来播放干扰不同方位角目标语音听力的词语或句子。

    麦克风422,424在工作上各自与麦克风-线路前置放大器432(Shure FP-11)相连接。各前置放大器432的输出提供给以声频前置放大器(Adcom GTP-5511)形式提供的双信道音量控制器434。音量控制器434的输出馈送入由得克隆斯仪器公司提供的数字信号处理器(DSP)扩展板440(型号TI-C6201 DSP计算组件(EVM))的A/D转换器。扩展板440包括定点DSP芯片(型号TMS 320 C62)其工作时标速度为133MHz,最大通过量为1064 MIPS(百万个指令/秒)。形成这种DSP执行软件来实时实施程序140。使用16位A/D和D/A转换时这些实验的采样频率约为8kHz。FFT的长度是256个采样,每16个采样计算一个FFT。产生要求信号特性记录和引出的计算结果发现在输入与输出间的延时约在10-20毫秒。

    图7和8各自画出了能量近似相同的三个声频信号的轨迹。在图7中,目标信号轨迹表示在分别从方位角22°和-65°播放的两个干扰信号轨迹之间。这些方位角均在图1中画出。目标声音为预先记录的女性语音(第二轨迹),且由位于0°的扬声器发出。一个干扰声音由一女性谈话者提供(图7的上轨迹),而另一干扰声音由一男性谈话者提供(图7的下轨迹)。相应谈话者所重复的短语音在各自轨迹的上方重述。

    参照图8,如上轨迹所显示的,当目标讲话声音在存在两个干扰源情况下发出时,其波形(及能谱)被混杂。这种混杂的声音对大多数听者特别是对有听力障碍的听者来说很难听懂。如板440所体现的,程序140用高保真度对此混杂信号进行处理并通过显著地抑制干扰声音而引出目标信号。因而,目标信号的清晰度又恢复到如第二轨迹所示的情况。清晰度得到大大改善,与原来目标信号相象的引出信号为进行比较又作为图8的下轨迹而重现。

    这些实验表明对干扰声音有明显的抑制。规则化常数(数值约在1.03)的利用有效地限制了计算出的加权的幅度,同时在目标源略微离轴时,如助听器佩戴者的头部稍微偏离目标谈话者时所发生的情况,得到的输出其声音畸变仍小得多。使用本领域熟练技术人员所知道的技术可以提供适合于助听器尺寸和其他应用尺寸的微型化技术。

    图11和12是由计算机产生的过程520模拟结果的图像图形。这些图形画出了以度表示的方位角与以秒表示的时间关系的定位结果。这些定位结果画成为阴影,其中阴影越黑,在该角度和该时刻的定位结果越有力。这样的模拟为本领域的熟练技术人员所接受并用来表示这种过程的功效。

    图11画出了当目标声频源大体上停留在离轴约10°方向时的定位结果。目标的实际方向用黑实线表示。图12画出了方向在+10°和-10°间呈正弦波变化的目标的定位结果,助听器佩戴者幌动他或她的头部就可以是这种情况。源的实际位置仍然用黑实线表示。过程520的定位技术准确地指明了在两种情况下目标源的位置,因为较黑的阴影与实际位置线紧密地符合。因为目标源并非总是产生没有干扰叠加的信号,故定位结果只有在一定时间才是有力的。在图12中,这些有力的间隔可记录在约0.2,0.7,0.9,1.25,1.7及2.0秒。当然在这些时间之间都很容易地估算出目标的位置。

    这里说明的实验只是为了演示本发明一种处理系统的工作情况。如本领域熟练技术人员会想到的那样,设备、语音材料,谈话者的相对位置和/或参数可能改变。

    这里阐述的任何理论,工作原理,证明,或结果都意在进一步增强对本发明的了解而并不是想要使本发明以任何方式依赖于这种理论,工作原理,证明,或结果。虽然在附图和上述说明中已经详细地说明了本发明,但其同样将被看成是举例说明而不是在性质上的限制,当然只有已经示出和说明的选定实施方案以及如此处或由下述权利要求限定的、出现在本发明构思内的所有变动、修正和同样事项才希望受到保护。

干扰抑制技术.pdf_第1页
第1页 / 共43页
干扰抑制技术.pdf_第2页
第2页 / 共43页
干扰抑制技术.pdf_第3页
第3页 / 共43页
点击查看更多>>
资源描述

《干扰抑制技术.pdf》由会员分享,可在线阅读,更多相关《干扰抑制技术.pdf(43页珍藏版)》请在专利查询网上搜索。

所公开的系统(10)包括声频传感器阵列(20),其与处理器(42)连接。系统(10)处理来自阵列(20)的输入,通过抑制干扰信号将要求的声频信号引出。使用使得到的输出信号方差最小所选定的加权通过修正频域中阵列(20)的输入来进行引出/抑制,同时使在要求声频信号方向上接收到的信号的放大倍数保持为单位放大倍数。系统(10)可以应用在助听器,语音输入装置,监听装置,及其他应用中。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1