声源的位置确定 【技术领域】
本发明涉及通过电声换能器进行声源位置确定。背景技术
在许多领域, 确定声源位置, 例如, 确定演讲者、 歌手、 演员或其它静止或移动声源 的位置, 或者跟踪它们在空间中的移动, 是非常必要的。可以再使用有关位置、 距离以及方 向的信息, 尤其从该方向捡拾声音, 并且掩盖其它方向的背景噪声, 从而跟踪摄像头, 监控 房间中的声音事件 ( 需要照顾的人员或房间里的残障人士, 防盗警报等 ), 其中利用该摄像 头可以记录一个接一个出现的移动声源或不同的声源。发明内容
具体地, 本发明涉及麦克风装置, 其至少具有两个压力梯度换能器, 各自具有膜 片, 各压力梯度换能器具有第一声音入口开口, 其通向膜片的前面, 以及第二声音入口开 口, 其通向膜片的背面, 并且, 其中各压力梯度换能器的方向特性具有最大敏感度方向, 即, 主方向, 并且, 其中压力梯度换能器的主方向相对于彼此相互倾斜。 本发明还涉及一种确定声源相对于麦克风装置的方向和 / 或位置的方法。
为此目的已经提出了现有技术, 利用彼此相互隔开的几个麦克风, 也称为麦克风 阵列, 由声波的传播时间或相位差确定到达声音的方向。
GB344967A 公开了一种为军用目的确定声源位置的器件。四个相互隔开的梯度换 能器彼此成 90°角倾斜, 并且通过磁线圈进行耦合。在磁线圈效应区域, 安装了旋转的指 针。作为各自线圈中产生的磁场的函数被偏转, 并且指向外部声源的方向。
现有技术中提出的方案是基于时间延迟的, 其能够提供关于角度或方向的信息, 但是时间延迟检测的原理需要几公分范围的设置, 以便也能够检测低频相位差。
本发明的目的在于以足够的精度确定声源的方向和距离, 然而, 无需依赖于时间 延迟和换能器设置的相关的大维度缺陷。该位置确定应该是可靠地、 快速地并且在大频率 范围内可复制。
利用上述麦克风装置实现这些目标, 其中, 该麦克风装置至少具有一个压力换能 器, 压力梯度换能器和压力换能器的声学中心位于假想的球体半径之内, 该半径对应于换 能器的膜片的最大维度的两倍。
最后一个标准确保所有换能器的必需的一致位置。在更优选的实施例中, 压力梯 度换能器和压力换能器的声学中心位于假想的球体内部, 该球体的半径对应于换能器的膜 片的最大维度。 通过将声音入口开口移动到一起来增加一致性, 可以实现特别优越的结果。
还可以利用上述方法实现本发明的目的, 其中, 通过换能器设置来进行声源位置 的确定, 换能器设置中至少包括一个压力换能器, 也称为零阶换能器, 以及至少两个梯度换 能器, 其中, 梯度换能器的主方向相对于彼此倾斜。 压力换能器和梯度换能器处于一致设置 中, 即, 它们彼此尽可能接近放置。
根据本发明, 将换能器的实际信号与数据库的多个已存储的信号相比较, 各个已 存储的信号对应于换能器, 并且利用有关麦克风装置的位置信息进行编码, 并且根据实际 信号和已存储的信号之间的匹配水平进行声源的位置确定。
本发明利用了近场效应, 也称为邻近效应, 如果声源处在梯度换能器的附近, 该邻 近效应发生在梯度换能器中, 并导致低频中的增加。 声源和梯度换能器彼此越接近, 对于低 频的过分强调就越强。近场效应大约从比所考虑频率的波长 λ 更小的麦克风间距处开始。 附图说明
以下参考附图进一步描述本发明。附图中,
图 1 示出远场和近场之间的过渡, 作为距声源的距离 r 和声波频率 f 的函数 ;
图 2 示出以 dB 计的声速水平, 作为距声源不同距离 r 的频率的函数 ;
图 3 示出梯度换能器, 其中声音入口开口在振膜仓外壳的相反侧 ;
图 4 示出梯度换能器, 其中声音入口开口在振膜仓外壳的相同侧 ;
图 5 示出压力换能器的横截面 ;
图 6 示出根据本发明的麦克风装置的平面图, 其中以下将描述单独换能器的拾音 模式 ;
图 7 示出根据本发明的麦克风装置的曲面图 ;
图 8 示出根据本发明的麦克风装置, 其中, 将所有换能器容纳在公共外壳中 ;
图 8a 示出接口中嵌入的换能器设置 ;
图 8b 示出接口上放置的换能器设置 ;
图 9 示出根据本发明的麦克风装置, 其包括 4 个梯度换能器和一个压力换能器 ;
图 9a 示出一种设置, 其包括 4 个梯度换能器和 4 个压力换能器 ;
图 10 示出优选的一致条件的示意图 ;
图 11 示出一种设置, 其包括 2 个具有超心型特征的梯度换能器以及一个压力换能 器;
图 12 示出根据本发明的换能器设置的测量 ;
图 13 示出确定空间坐标的框图 ;
图 14 示出已存储曲线族和测量曲线的图示。 具体实施方式
在研究换能器设置之前, 需要对近场效应做一些解释 : 数学上, 可以通过换能器概 念中的差异解释近场效应。 在平坦的声场中, 声压和声速总是同相的, 从而对于平坦声场没 有近场效应。对于球形声场的一般情况, 必须区别声压和声速。声压幅度在球形声源中随 1/r 减小 ( 其中, r 表示距球形声源的距离 ), 从而在压力换能器, 也称为零阶换能器中, 不 发生近场效应。由两个条件得到球形声源的声速 :
其中, ρ...... 密度 r...... 距声源的距离 c...... 声速 λ...... 波长 t...... 时间 ...... 相位k...... 圆波 (Circular wave) 数目 (2π/λ 或 2πf/c)
A...... 幅度
f...... 频率
由公式 (1) 和 (2) 可明显看出, 声速在远场随 1/r 减小, 而在近场中随 1/(k×r2) 减小。作为距离和频率的函数利用压力梯度麦克风拾音的信号电平的增加从图 1 和图 2 可 明显看出。近场和远场之间的分离按 k×r = 1 给出, 近场和远场之间的过渡区域受 k×r = 2 和 k×r = 0.5 限制。
可由如下公式描述各单独梯度振膜仓的特征 :其中, a 表示全向部分 (omni fraction) 的权重因子, b 表示梯度部分的权重因子。 对于数值 a = 1, b = 1, 得到心型曲线, 对于 a = 1 和 b = 3, 得到超心型曲线。
一般而言, 作为梯度麦克风入射角的函数, 可将梯度麦克风的增强因子 B 描述为 邻近效应的结果, 这在控制学系的 Philip S.Cotterell( 学士、 硕士、 AMIEE) 于 2002 年 2 月 提交的学位论文 “On the Theoryof the Second-Order Sound Field Microphone” 中被描 述为 :
角度 θ 表示球形坐标的方位角, 而 表示仰角。对于心型曲线 (a = 1, b = 1) 的 简单情况, 增强因子 B 在 (k×r) 的较大数值处, 即较大距离 r 和较高频率 f, 假设如下形式 :
对于增加的 (k×r), 该表达式接近数值 1。 在较小数值 (k×r) 处, 对于增强因子 B 获得如下表达式 :由此可明显看出, (k×r) 的较小值导致了水平的连续增加。 如果在公式 (4) 中插入 180°的方位角 θ, 对增强因子 B 可获得与公式 (6) 中的相同的表达式。这意味着近场效应具有 8 字形的特征类型 ( 对于 90°的方位角 θ, 对于 k×r 的依赖消失了 )。
仅在压力梯度换能器中, 即, 方向性麦克风中出现近场效应, 而压力换能器中不存 在近场效应, 并且, 近场效应关于声音接收器的主方向依赖于声音的入射角度。这意味着, 例如, 在心型曲线或超心型曲线的主方向中, 近场效应最强最明显, 而可以忽略对其倾斜 90°的方向。为了确定一致换能器设置 (coincident transducer arrangement) 和声源之 间的距离, 现在使用近场效应。由于压力换能器产生的全向信号 (omni signal) 不受邻近 效应影响, 梯度信号和全向信号之间的比较可确定距声源的距离。
具体地, 可利用以某距离或方向编码的已存储的数据集与单独的换能器信号或从 其获得的信号进行比较, 来确定距离。根据本发明, 利用测试声源的测试脉冲, 通过向源自 房间中的一些点的声音暴露换能器设置, 准备数据集, 所述这些点相对于一致换能器设置 具有不同的方向和距离。
以下进一步描述根据本发明的换能器设置的例子, 其中, 参考图 3 到 5 简要解释优 选换能器类型。
图 3 和图 4 示出了 “正常” 梯度振膜仓和 “平坦” 梯度振膜仓之间的差异。在前者 中, 如图 3 所示, 声音入口开口 a 位于振膜仓外壳 4 的前面, 而声音入口开口 b 在振膜仓外 壳 4 相对的背侧上。前部声音入口开口 a 连接到膜片 5 的前部, 膜片 5 拉紧在膜片环 6 上, 而背部声音入口开口 b 连接到膜片 5 的背侧。 对于所有压力梯度, 膜片的前面是声音可相对无阻碍到达的一侧, 而仅当声音通 过声学相位旋转元件才能抵达膜片的背面。一般而言, 到前面的声音路径比到背面的声音 路径更短, 而到背面的声音路径具有很高的声学摩擦 (acoustic friction)。 在电极 7 之后 的区域中, 在多数情况下存在声学摩擦 8, 其可以被设计成压缩物、 非纺织物或泡沫的形式。
在图 4 的平坦梯度振膜仓, 也称为接口麦克风中, 在振膜仓外壳 4 的前面提供了 声音入口开口 a、 b, 其中, 一个通向膜片 5 的前面, 另一个经由声音通道 9 通向膜片 5 的背 面。该换能器的优势在于能够被集成在接口 11 中, 例如, 车辆中的控制台中, 并且, 由于可 以将声学摩擦器件 8, 例如, 非纺织物、 泡沫、 压缩物、 穿孔物、 平板等布置在膜片 5 附近的区 域中, 所以可能得到非常平坦的设计。
通过将声音入口开口 a、 b 布置在振膜仓的一侧, 实现了相对于膜片轴的非对称拾 音模式, 例如, 心型曲线、 超心型曲线等。在 EP 1351 549 A2 或对应的美国 6,885,751 A 中 详细描述了这样的振膜仓, 以引用形式将其全部内容包含在本说明中。
图 5 中示出了压力换能器, 也称为零阶换能器。在零阶换能器中, 仅膜片的前面被 连接到外部环境, 而背部面对着的是封闭容积。 在后部容积中存在天然的小开口, 其假设为 对静态压力变化的补偿, 但是, 这些对于动态属性和拾音模式不起作用。作为频率的函数, 可以得到该结果的微小偏差。
在开始信号处理和对声源进行空间定位之前, 可以通过换能器设置实现本发明的 目标, 以下将进行描述。
现在图 6 示出根据本发明的麦克风装置, 其由三个压力梯度换能器 1、 2、 3, 以及由 压力梯度换能器包围的压力换能器 5 构成。该压力梯度换能器的拾音模式包括全向部分和 8 字形部分。实质上, 可以用 P(θ) = k+(1-k)×cos(θ) 来表示该拾音模式, 其中, k 表示
角度无关的全向摩擦, 而 (1-k)×cos(θ) 表示角度相关的 8 字形摩擦。 参考等式 (3), 已经 处理了该拾音模式的替代数学描述, 其也进行了归一化。在图 6 下部绘出的单独的换能器 的方向性分布之后, 本情况涉及具有心型曲线特征的梯度换能器。然而, 原则上, 从球形和 8 字形组合得到的所有梯度, 比如超心型曲线, 都是可以想得到的。
理想情况下, 压力换能器 5 的拾音模式是全向的。作为制造容限和质量的函数, 在 较高频率处可能从全向形式存在偏离, 但是, 总是基本上通过球形来近似描述拾音模式。 相 比梯度换能器, 压力换能器仅有一个声音入口开口, 因此, 膜片的偏转正比于压力, 而不是 膜片的前面和背面之间的压力梯度。
所述实际例子中的梯度换能器 1、 2、 3 位于 x-y 平面上, 并且基本上均匀分布在假 想圆的圆周上, 即, 它们几乎彼此间距相等。 在三个梯度换能器的情况下, 它们的主方向 1c、 2c、 3c( 最大敏感度的方向 ) 彼此倾斜, 约成 120°方位角 ( 图 6 的下面部分 )。在 n 个梯度 换能器中, 它们的主方向之间的角度在平面上是 360° /n。
原则上, 任何类型的梯度换能器都适于实现本发明, 但是, 所述的变型尤其适合, 因为, 其涉及了平坦换能器或所谓的接口麦克风, 其中, 两个声音入口开口位于相同一侧的 表面, 即, 接口上。 从图 6 回到根据本发明的麦克风装置, 现在的特性在于彼此一致地设置换能器 1、 2、 3、 5, 即, 它们彼此相对取向, 从而通向对应的膜片的前面的声音入口开口 1a、 2a、 3a、 5a 彼此相互临近, 然而, 梯度换能器的声音入口开口 1b、 2b、 3b 位于该设置的外围, 它们通向 膜片的背面。在后续解释中, 将延长连接线的交叉点视为麦克风装置的中心, 其中, 此交叉 点将前部声音入口开口 1a 或 2a 或 3a 连接到后部声音入口开口 1b 或 2b 或 3b。优选地, 现 在压力换能器 5 位于该设置的中心处。在图 6 的较低区域处, 梯度换能器的主方向 1c、 2c、 3c 所指向的是中心。因此, 两个换能器 1、 2 和 3 的前部声音入口开口 1a、 2a、 3a, 也称为语 音输入口, 它们处于此设置的中心区域。通过这样的手段, 可以显著增强换能器的一致性。 现在, 根据本发明, 压力换能器 5 位于麦克风装置的中心区域, 其中, 优选地, 压力换能器 5 的单个声音入口开口位于压力梯度换能器 1、 2、 3 的声音入口开口的连接线交叉点处。以下 的考虑将麦克风装置限制为特定的功能良好的变型。
一致性产生, 这表现在梯度换能器 1、 2、 3 和压力换能器 5 的声学中心尽可能彼 此靠近, 优选地, 位于同一点处。将互补换能器 (reciprocal transducer) 的声学中心定 义为当换能器作为声源时球形波由其发散出去的点。Jacobsen, Finn ; BarreraFigueroa, Salvador ; Rasmussen, Knud 于 2004 年在 AcousticalSociety of America Journal 第 115 卷第 4 期第 1468-1473 页上的论文 “A note on the concept of acoustic center” 检查 了确定声源声学中心的各种方法, 包括基于偏离反距离定律 (inversedistance law) 的方 法以及基于相位响应的方法。通过对电容式麦克风的实验结果来阐释该考虑的事项。通过 引用在此描述中包含所述论文的内容。
可以通过利用距小空间区域中, 即观察点中的变换器某方向以及某距离的某频率 对声学换能器进行正弦激励期间测量球形波波前来确定声学中心。 从有关球形波波前的信 息开始, 可以得到有关球形波中心, 即声学中心的结论。
在 Salvador Barrera-Figueroa 和 Knud Rasmussen 于 2006 年发表于 The Journal of the Acoustical Society of America 第 120 卷第 5 期第 2668-2675 页的论文 “The
acoustic center of laboratory standardmicrophones” 中可找到将声学中心概念应用于 麦克风的详细表述, 将此论文的内容作为引用包含在本文描述中。作为确定声学中心的很 多可能之一, 将此论文所述的方法简要描述如下 :
类似电容式麦克风, 对于互补换能器, 是将此换能器作为声音发射器还是声音接 收器并不重要。在上文中, 经由反距离定律确定声学中心 :
其中, rt 是声学中心,
ρ 是空气密度,
f 是频率,
Mf 是麦克风敏感度,
i 是电流,
y 是复数波传播系数。
该结果仅关于压力接收器。此结果表明, 对于平均频率 ( 在 1kHz 范围内 ) 确定的 中心偏离对于高频确定的中心。这种情况下, 将声学中心定义为小区域。对于确定梯度换 能器的声学中心, 此处使用完全不同的方法, 因为, 公式 (7) 没有考虑近场相关的依赖。可 以如下提出有关声学中心的问题 : 换能器必须围绕哪个点旋转, 以便观察到与观察点处相 同的波前相位。
在梯度换能器中, 可以从旋转对称开始, 从而声学中心可以仅位于与膜片平面正 交的线上。可以通过两种测量确定任意线上的准确点 -- 最优选地, 从 0°的主方向以及从 180°方向。除了对这两种测量的相位响应进行比较之外, 其中, 测量可确定频率依赖的声 学中心, 对于声学中心的平均估计, 最简单的是改变换能器在测量之间围绕旋转的旋转点, 从而脉冲响应最大程度地重叠 ( 或者, 换言之, 从而两个脉冲响应之间的最大相关位于中 心内 )。
所述 “平坦” 梯度振膜仓目前具有的属性是它们的声学中心不是膜片中心, 其中的 两个声音入口开口位于接口上。声学中心位于最接近通向膜片前部的声音入口开口处, 因 此, 在接口和膜片之间形成最短的连接。声学中心也可以位于振膜仓外部。
在使用其它压力换能器期间, 必须进行如下考虑 : 如果考虑压力换能器在 XY 平面 的膜片, 并且将 XY 平面中围绕 X 轴的任意角度指定为方位角, 将围绕 XY 平面的任意方向的 角度指定为仰角, 可以得到如下陈述, 实际上 :
压力换能器信号相对于理想全向信号的偏离通常随着频率增加 ( 例如, 1kHz 以 上 ) 而变得更大, 但是在声音由不同仰角暴露期间, 其增加得更加强烈。
由于这些考虑, 当在接口上设置压力换能器时, 得到了特别优选的变型, 从而膜片 几乎平行于接口。 作为另一种优选变型, 膜片的位置尽可能靠近接口, 优选地, 与接口齐平, 但是, 至少在对应于膜片的最大维度的距离之内。 因此, 也很容易解释压力换能器的声学中 心的定义。这样的布局的声学中心位于在膜片中心处与膜片表面正交的线上。作为良好的 近似, 为简便起见, 可以假设声学中心位于膜片中心内的膜片表面上。
本发明的一致标准要求, 压力梯度振膜仓 1、 2、 3 和压力换能器 5 的声学中心 101、
201、 301、 501 位于假想的球形 O 内部, 此球形的半径 R 是换能器膜片的最大维度 D 的两倍。
在更优选的实施例中, 压力梯度换能器和压力换能器的声学中心位于假想的球形 内部, 此球形的半径对应于换能器膜片的最大维度。通过移动声音入口开口到一起以增强 一致性, 可以实现特别的结果。
在如图 10 中示意性示出的优选的一致性条件下, 已经证明了是特别优选的根据 本发明的换能器设置 : 为了确保这个一致性条件, 压力梯度振膜仓 1、 2、 3 和压力换能器 5 的 声学中心 101、 201、 301、 501 位于假想的球形 O 内部, 此球形 O 的半径 R 等于换能器膜片的 最大维度 D。随后利用虚线指出膜片 100、 200、 300、 500 的尺寸和位置。
作为另一种选择, 也可以描述此一致性条件, 因为第一声音入口开口 1a、 2a、 3a 和 压力换能器 5 的声音入口开口 5a 位于假想的球形 O 内部, 此球形 O 的半径 R 对应于换能器 的膜片 100、 200、 300、 500 的最大维度 D。 与使用最大膜片维度 D( 例如, 圆形膜片的直径, 或 者三角形或矩形膜片的边长 ) 来确定此一致性条件相伴随的事实是膜片的尺寸确定噪声 距离, 由此, 代表了声学几何的直接标准 (directcriterion)。
可以很自然地设想到膜片 100、 200、 300 和 500 不具有相同的维度。这种情况下, 使用最大的膜片确定优选标准。 在图 6 所述的实际例子中, 在平面上布置换能器 1、 2、 3、 5。 单个换能器的连接线将 前部声音入口开口和后部声音入口开口相互连接, 连接线相互倾斜, 成约 120°角。
图 7 示出本发明的另一种变型, 其中, 并没有将两个压力梯度换能器 1、 2、 3 和压力 换能器 5 布置在一个平面上, 而是布置在一个假想的球形表面上。这可以是实际中的例子, 当在曲线接口上, 例如, 车辆的控制台上布置麦克风装置的声音入口开口时。为简明起见, 图 7 中没有示出其中嵌入了换能器或者其上固定了换能器的接口。
一方面, 图 7 中的曲率表示到中心的距离减小 ( 这是期望出现的, 因为, 声学中心 位置靠近在一起 ), 然而, 另一方面, 语音输入开口因此有些被遮蔽。此外, 这改变了单个振 膜仓的拾音模式, 从而信号的 8 字形部分变得更小 ( 从超心型曲线随后形成心型曲线 )。 为 了不让遮蔽的缺陷占上风, 优选地, 曲率不应该超过 60°。换言之, 压力梯度振膜仓 1、 2、 3 位于假想的锥体的外部表面上, 此锥体的表面线与锥体轴线至少形成 30°角。
通向膜片前面的梯度换能器的声音入口开口 1a、 2a、 3a 位于一个平面中, 此后称 其为基础平面, 然而, 曲线接口上布置的声音入口开口 1b、 2b、 3b 位于此基础平面的外部。 将梯度换能器 1、 2、 3 的主方向投射到如此定义的基础平面中形成了等于基本上 360° /n 的 角度, 其中, n 表示圆形中布置的梯度换能器的数目。
作为利用平面中布置的振膜仓的实际例子, 在此实际例子中, 压力梯度换能器的 主方向彼此相互倾斜, 形成方位角 即, 它们不仅在锥体轴平面中彼此相互倾斜, 而且在与 锥体轴正交的平面中, 主方向的投射也彼此相互倾斜。
梯度换能器 1、 2、 3 和压力换能器 5 的声学中心也位于假想的球形内部, 其半径对 应于图 7 的设置中的换能器膜片的最大维度。通过声学中心在空间上的接近, 实现了本发 明所需要的一致性, 尤其对于进一步的信号处理。在图 6 的变型中, 将图 7 所述的振膜仓也 优选地布置在接口上, 例如, 嵌入其中。
图 8A 和 8B 中示出了将振膜仓布置在接口上的可能性。在图 8A 中, 示出了来自图 6 的麦克风装置部分, 振膜仓位于接口 20 上或者固定到接口 20, 然而, 在图 8B 中, 它们被嵌
入接口 20 中, 并且它们的前侧与接口 20 齐平。
可以设想另一种变型, 其中, 将压力梯度振膜仓 1、 2、 3 和压力换能器 5 布置在公共 外壳 21 内部, 其中, 膜片、 电极以及单独换能器的安装通过隔离物彼此分开。从外部不再能 看到声音入口开口。公共外壳的表面可以是平面 ( 称为根据图 6 的设置 ) 或者曲面 ( 称为 根据图 7 的设置 ), 其中公共外壳的表面内布置了声音入口开口。接口 20 本身可以设计为 板式、 控制台、 壁式、 包覆层等。
图 11 示出根据本发明清楚确定方位角和距离 r 的构造, 其中, 仅利用两个梯度换 能器 1、 2 和压力换能器 5 进行构造。 进行这种设置的一个重要标准是使用梯度换能器, 其拾 音模式是超心型曲线或非常类似于超心型曲线。因此, 在 180°方向到主方向 1c、 2c 之间, 存在具有明显清楚的信号部分的麦克风。优选的变型是两个压力梯度换能器 1、 2 的定位, 从而, 主方向 1c、 2c 相互几乎成 90°。此处的不明确在于将水平差异解释为近场效应的结 果, 但是, 可以额外使用相位差异, 以便清楚确定方位角和距离。 自然地, 上述一致性条件也 可再次应用于此布置。
然而, 上述的所有换能器设置适于相对于换能器设置的方位角 θ 和距离 r 对声源 进行定位, 以下描述的换能器设置也允许确定仰角 以及声源在空间中的清晰的分配。 图 9 中示出了这样一种麦克风, 其无需单方声音入口麦克风 (one-sided sound inlet microphone) 就可工作。此外, 代替仅仅三个梯度换能器, 现在在空间设置中使用四 个梯度换能器。在各个压力梯度换能器 1、 2、 3、 4 中, 将第一声音入口开口 1a、 2a、 3a、 4a 布 置在振膜仓外壳的前面, 将第二声音入口开口 1b、 2b、 3b、 4b 布置在振膜仓外壳的背面。压 力换能器 5 仅在前面具有声音入口开口 5a。通向膜片前部的第一声音入口开口 1a、 2a、 3a、 4a 彼此相对, 再次满足了它们位于假想的球形内部的要求, 其中, 此球形的半径是换能器之 一中的膜片的最大维度的两倍。根据本发明, 梯度换能器的主方向面对麦克风装置的公共 中心区域。
详细讨论图 9 中布置的维度的例子。假设此空间换能器设置包括与四面体表面一 致的理想平坦换能器, 得到膜片表面的最大直径 D 与外包围球体半径 R 的比例 :
实际上, 由于通常在刚性环上安装膜片, 并且不能将单个振膜仓制造得任意薄, 因 此, 不能利用延伸到四面体边缘的膜片实现这样的换能器设置。然而, 这不是问题, 因为已 经表明如果换能器设置, 尤其是通向膜片前面的声音入口开口, 位于假想的球体 O 的内部, 其中, 球体 O 的半径 R 等于换能器之一的膜片的最大维度 D 的两倍, 则此发明的概念奏效。
优选地, 如图 9 所示, 在假想的四面体的表面上布置梯度换能器, 并通过间隔装置 50 将其彼此隔开, 以便在设置的中心为压力换能器 5 产生空间。 利用麦克风竿 60 固定整个 设置。
如参考图 10 所解释, 一致性条件自然地还应用于具有四个压力梯度换能器的设 置。本发明不限于所述变型。原理上, 也可以提供多于四个梯度换能器, 以便通过求和形式 从它们的信号得到合成的全向信号。
如图 9a 所示, 也可以提供几个压力换能器 5、 5’ 、 5” 、 5” ’ 。通过对单独的压力换能
器的全向信号求和, 可以再次形成全向信号, 其仍为同质的, 近似为理想的球形, 并且独立 于频率。在本实际例子中, 提供了四个压力换能器 5、 5’ 、 5” 、 5” ’ , 它们各自布置在四面体表 面, 声音入口开口直接朝外。提供间隔装置 50, 以便在空间中固定压力换能器或梯度换能 器。在信号处理期间, 单独的梯度换能器信号与合成的全向信号相关。
以下进一步进行单个换能器信号的信号处理和声源的定位 :
在能够使用所述的麦克风类型之前, 必须对其进行测量。通过扬声器 112 测量根 据本发明的换能器设置 111, 以相对于换能器设置 111( 在图 12 中用箭头示出 ) 的不同方位 角 θ、 不同仰角 以及不同距离 r 连续放置扬声器 112, 并在各位置发出测试信号。
优选地, 发出 Dirac 脉冲作为测试脉冲, 即, 可能的持续时间最短的脉冲, 因此, 包 含整个频谱。一致性换能器设置的各个换能器 n 的脉冲响应 In(r, θ, ) 被缩短, 并且提 供了坐标 (r, θ, ), 参考换能器设置 111, 其对应于测试声源 112 的位置。一般而言, 可以 将测量结果存储在数据库中, 其中, 由参数距离 r、 方位角 θ、 仰角 和换能器 n 确定各频率 响应。
在适当的操作中, 通过将已记录的时间事件与已存储的脉冲响应相比较, 对各脉 冲响应进行过滤, 从而得到一致 (agreement) 或高相似性, 然后为入射声音分配专门的坐 标。 以下在实际例子中精确进行此方法, 其中, 在任何时刻由所获取的麦克风信号以 适当操作能够估计声源的参数距离 r、 方位角 θ 以及仰角
以面向块的方式对单个换能器信号进行分析, 即, 利用 A/D( 模拟 / 数字 ) 换能器 对麦克风信号进行初始数字化, 并且在一定数量的样本到达之后, 将一些组合进块中, 并由 所期望的块长度进行定义。 原理上, 利用每个新到达的样本, 可以由之前的一定数量的样本 以及利用数字信号的抽样频率进行计时的决策算法完成块。然而, 实际上, 一方面, 这将遇 到计算能力的限制, 另一方面, 已经足够对与 25fps( 帧 / 秒 ) 的视频技术相似的时间分辨 率进行跟踪。
在对换能器信号与已存储数据进行比较期间, 根据一致的大小进行决定。如果大 的一致占优, 决定可以是正面的, 而如果没有一致占优或者不充分的一致占优, 则决定是负 面的。仅将正面的决定用于对声源进行定位。
块的尺寸是对频率分辨率的量具, 因此, 也是对决定质量的量具。 如果选择的块长 度太小, 将很容易导致不正确的决定。利用增加的块长度, 决定的准确率增加, 从而导致计 算开销增加。
图 13 在框图中图示性描述了通过麦克风装置进行的算法, 其中, 麦克风装置中包 括梯度振膜仓 1、 2、 3、 4 以及全向振膜仓 5( 对应于图 9)。初始时, 对换能器信号进行模拟 / 数字转换, 并馈送到块单元 120, 其中, 在块中将单独的信号发送到随后的单元。 假设利用通 过虚线构成的随后区域解释其中进行的所有计算都是涉及当前的信号块。
在所述例子中仅将频率分析单元 121 应用于压力换能器 5 的全向信号, 频率分析 单元 121 分析信号, 从而确定信号中表示的最强烈或者具有最高水平的频率分量 fis。
将这样发现的离散频率 fi 划分为两组。较低的频率组 FU 包含频率 fi, 其约在 FU , 从 20 到 1000Hz 范围中表达最为强烈, 而较高频率组 FO 包含频率 fi,FO, 其约在从 1000 到 4000Hz 范围内表达最为强烈。可以以不同的方式自然地选择所述的限制, 但是, 必须记住,
较高频率组 FO 的频率 fi, FO 不受近场效应的明显影响。
在第一步骤中, 确定声源的方向。取决于换能器设置 111, 可以仅确定方位角 ( 利 用 3 个梯度换能器 ) 或方位角和仰角 ( 利用 4 个梯度换能器 )。为此, 较高频率组 FO 的频 率 fi, 并 FO 中的电平和来自所存储数据库的信息是必须的。将数据集存储在存储器 125 中, 可从其中调出。由于近场效应对于确定角度不重要, 仅使用其中近场效应极小的频率来确 定角度。
在方向确定单元 123 中对换能器信号进行处理, 将其划分为块, 并与所存储的 数据集进行比较, 以确定方向。初始时, 对于每个换能器信号, 例如, 利用 FFT( 快速傅里 叶变换 ) 形成各块的频谱。然后对频谱进行平滑 ( 例如, 利用固定的 1/3 倍频程带宽 (octavebandwidth)), 从而局部最小不会使结果失真。
对于频率组 FO 的某些单个离散频率 fi,FO, 现在可以确定角度 ( 以下可进一步看 出 )。在此应该指出, 在本文后面, 可将表述 “角度” 理解为方位角和仰角, 相应地, 对于平角 确定的情况 ( 仅在 2 个或 3 个梯度换能器中 ), 仅是方位角或仅是仰角。
结果, 即, 对频率 fi,FO 找到的角度, 被存储, 并开始对下一个频率点进行计算。为 几个频率 fi, 获得对估计角度的一种统计。如果对特定角度的命中出现累 FO 确定角度之后, 积, 可以由此得出结论, 在对应的方向存在声源。如果关于此角度的决定是正确的, 可以开 始确定对距离 r 的估计。通过决定单元 124 进行决定, 为决定单元 124 提供方向确定单元 122 的结果。
另一方面, 如果发生或多或少地均匀分布的角度决定, 可以从其推断, 该信号有噪 声, 并不能对该块进行检测。决定单元 124 忽略该块的结果, 并接管前块的参数。
详细地, 如下对角度进行比较和确定。 初始时, 在换能器块的平滑频谱中考虑频率 fi, 将此频率 fi, FO。对于梯度换能器 n, FO 处的电平指定为 Gn(fi, FO)。通过将换能器信号的梯 度换能器对全向换能器的电平比例与已存储数据集的梯度换能器与全向换能器的电平比 例进行比较, 可以确定方向确定单元 122 中的角度, 其中已存储数据集是从测试测量得到 的。
V(fi,FO) 是频率 fi,FO 处梯度换能器信号电平 Gn(fi,FO) 与压力换能器电平 K(fi,FO) 的比例。
VD(fi, 其中, In(f) FO) 是从存储器 125 中存储的数据库的数据集中获取的对应比例, 是梯度换能器 n 的对应脉冲响应的频谱, 而 Ik(f) 是压力换能器的脉冲响应的频谱。
现在, 从此数据库可获取所有比例 VD(θ, r, f), 并用于确定方向。应该滤出从 工作的换能器获得的数据集, 其中, 该数据集与比例 V(f) 间具有最有可能的一致。
对于各个离散频率 fi, 现在找出如下表达式的最小值 : FO,
平方 VD2-V2 的引入意味着对功率的最小值感兴趣。然后对不同数据集上求和得到 的不同距离 rm 进行分配。在角度方位角 θmin 和仰角 中发现的功率最小值 A 的特征在 于其为已记录信号与已存储数据集之间的最佳一致。对不同频率 fi, FO 继续该处理。如果发 现该结果几乎给出相同的角度, 决定单元 124 也将该角度归类为正确。可以对各块进行该 处理, 从而, 连续更新位置确定, 并且还可在空间中跟踪移动的声源。
如果现在正确确定方向, 也可以估计过渡设置 111 与声源之间的距离。
为确定该距离, 将已经在方向确定单元 122 中平滑的单独的换能器块的频谱馈送 到距离确定单元 123 中。相比角度确定, 现在评估较低频率组 FU 的较低频率 fi, FU 处的曲线 趋势。
频率 fi, FU 在公式中指代在频率分析单元 121 预先选出的那些频率。
由于近场效应具有一种 8 字形特征, 其证明该处仅使用梯度换能器比较合适, 对 于梯度换能器, 信号 G 或比例 V 最大。因此, 可以专门使用 Vmax 计算该距离。
如下表达式的最小值给出距离 rmin :
然后, Vmax 表示梯度换能器信号频谱与最大电平和全向信号频谱之间的比例。
公式 (14) 中的 numberFU 是离散频率点 fi, 在以上表达式中, 在该频率点 FU 的数目, 上进行求和。
表达式 B(r) 在估计值 rmin 处变得最小, 然后转移到决定单元 124, 并由用于该块的 角度和距离完成估计。
作为解释, 图 14 示出一个示意图, 其中, 作为频率函数示出比例 Vmax(f), 其中, 通 过虚线 ( 曲线 e) 连接离散频率 fi, b、 c 和 d 对应于存储器 125 中存储的数据集 FU。曲线 a、 VD(f), 并且优选地根据公式 (14) 与 Vmax(f) 相比较。在这种情况下, 获得相对于曲线 c 最低 的偏离, 并且表达式 (14) 变得最小。然后, 曲线 a 对应于相对麦克风装置的远距离, 几乎处 于远场中, 然而, 曲线 d 对应于近距离, 其中, 已经明显表现出近场效应。
如前所述, 参考角度, 分辨率依赖于最小梯度换能器数目和构造。在图 11 的布置 中, 应该加入两个梯度换能器的定位, 它们彼此成 90 度, 作为近场效应的结果, 在水平差的 解释中给出了歧义。如上所述, 由于近场效应具有 8 字形特性, 对于方向和距离可以找到两 个可能的声源位置。作为近场效应的结果, 一方面, 对于将梯度换能器 1 暴露到与主方向成 60°角的声音的声源, 另一方面, 对于将梯度换能器 1 暴露到来自 180°角的声音的声源, 都将出现测量电平的距离。这些情况下, 将不应该使用梯度换能器 2, 因为, 梯度换能器 2 的两个角度都位于接近于 90°的区域中, 其中不存在近场效应。然而, 现在怎么区分是在 60°还是在 180°处找到声源?在这种情况下, 可以借助于信号的相位位置, 因为梯度换能 器提供同相信号, 直到拒绝最大点 ( 对于超心型曲线在 109° ) 处, 超出拒绝角度, 则相位位 置旋转 180°。
除了具有 2 个超心型曲线和一个压力换能器的最小变型之外, 图 6 所示的设置还
可以确定方位角和距离。尽管此处不再使用梯度麦克风, 但是可以为敏感相位位置检测分 配超心型曲线, 或者限制于超心型曲线, 或者, 也可以丢弃类似超心型的拾音模式。
对于所有 3 个参数, 即, 距离、 方位角和仰角, 的检测, 至少三个彼此正交的梯度换 能器将是最优的, 还可具有压力换能器, 优选地, 其位于声学中心。
由于仅可一致性地产生该设置, 所以图 9 或 9a 所示的设置被证明是最优的, 因为 此处明确地覆盖了所有空间方向, 压力换能器 5 也可以另外位于梯度换能器装置的中心 处。
如果确定了声源的位置或方向, 作为其函数, 可以启动不同的行为。例如, 利用位 置数据可控制摄像机, 从而, 例如, 在视频会议期间, 其可以连续朝向声源。然而, 可以影响 到具有可控拾音模式的麦克风, 从而优选地利用波束形成算法捡拾有用的声源, 同时掩盖 其它方向。