音频会议电话的主持人模式.pdf

摘要
申请专利号：	CN201210059274.9	申请日：	2012.03.02
公开号：	CN102685339A	公开日：	2012.09.19
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):H04M 3/56申请公布日:20120919\|\|\|公开
IPC分类号：	H04M3/56; H04R1/20	主分类号：	H04M3/56
申请人：	米特尔网络公司
发明人：	彼得·库斯; 吴安杰
地址：	加拿大安大略省
优先权：	2011.03.04 US 12/932,764
专利代理机构：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	宋鹤
PDF下载：	PDF下载

内容摘要

本发明公开了音频会议电话的主持人模式。公开了用于在电话会议电话处接收来自电话会议主持人的声音的系统和方法。该方法包括识别充当电话会议主持人的人。确定所识别的电话会议主持人相对于电话会议电话的位置。将电话会议电话上的多个麦克风配置为波束成形接收器，以用于接收来自电话会议主持人的位置的音频信号。偏置多个麦克风中的选定麦克风以相对于从其它方向接收的声音来接收来自电话会议主持人的方向的声音。

权利要求书

1.一种用于在电话会议电话处接收来自电话会议主持人的声音的方法，包括：识别充当所述电话会议主持人的人；确定所识别的电话会议主持人相对于所述电话会议电话的位置；将所述电话会议电话上的多个麦克风配置为波束成形接收器，以用于每当来自所述电话会议主持人的位置的音频信号的幅度大于预定阈值电平时就接收来自所述位置的所述音频信号；以及偏置所述多个麦克风中的选定麦克风以相对于从相对于所述电话会议电话的其它方向接收的声音来接收来自所述电话会议主持人的方向的声音。2.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括将所述电话会议电话上的预定位置物理地移动到朝向所述电话会议主持人的方向。3.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括电子地识别所述电话会议主持人相对于所述电话会议电话的位置。4.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括使用所述电话会议主持人的语音识别来确定所述电话会议主持人相对于所述电话会议电话的位置。5.如权利要求1所述的方法，其中，将所述电话会议电话上的所述多个麦克风配置为波束成形接收器还包括对所述多个麦克风中的每个麦克风应用有限脉冲响应滤波器来形成空间滤波器。6.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括增大麦克风的灵敏度来增大对从所述位置接收的音频信号的接收。7.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括手动调节麦克风的灵敏度来调节对从所述位置接收的音频信号的接收的灵敏度。8.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括减小麦克风的灵敏度来减小对从除所述位置以外的其它方向接收的背景噪声的接收。

说明书

音频会议电话的主持人模式

技术领域

本发明涉及音频会议电话。

背景技术

会议扬声器电话(通常称作会议电话)是用来使得房间内的若干人可
以与另一地点的人通信的专用电话。会议电话通常没有电话听筒。而是，
会议电话通常包括单个扬声器和能够接收环绕会议电话360度的音频的许
多麦克风，使得处在会议电话周围的多个人能够经由会议电话通信。

会议电话共同的问题在于当在房间内存在背景噪声时拾取(pick up)
谁正在讲话的能力。背景噪声可能使得很难听到离会议电话最远的那些人
的发言。为了帮助解决此问题，已经设计了这样的会议电话，其具有的麦
克风具备被配置为通过使用波束成形(beamforming)来接收特定方向上的
音频的能力，波束成形集中(focus)麦克风在选定方向上接收的音频。

例如，会议电话中的麦克风可以被配置为接收说话最大声的人的音
频，同时衰减由定向在房间内其它方向上的麦克风所接收的声音。这可以
在最大化讲话的人的音频接收的同时最小化背景噪声的拾取。位于电话连
接的另一端(即，其它地点)的正在接收来自该会议呼叫的音频的人主要
听到带有有限背景噪声的扬声器。

将麦克风集中于从讲话最大声的人接收音频同时减少背景噪声的接收
使得位于其它地点的那些人能够听到人讲话。然而，其并不对谁讲话布置
任何优先级。每个人都被平等对待。这使得当电话会议的主持人讲话时，
她或他很难被听到，从而降低了电话呼叫的有效性。

发明内容

根据本发明的一个方面，提供一种用于在电话会议电话处接收来自电
话会议主持人的声音的方法，包括：识别充当所述电话会议主持人的人；
确定所识别的电话会议主持人相对于所述电话会议电话的位置；将所述电
话会议电话上的多个麦克风配置为波束成形接收器，以用于每当来自所述
电话会议主持人的位置的音频信号的幅度大于预定阈值电平时就接收来自
所述位置的所述音频信号；以及偏置所述多个麦克风中的选定麦克风以相
对于从相对于所述电话会议电话的其它方向接收的声音来接收来自所述电
话会议主持人的方向的声音。

在一个实施例中，确定所识别的电话会议主持人的位置还包括将所述
电话会议电话上的预定位置物理地移动到朝向所述电话会议主持人的方
向。

在一个实施例中，确定所识别的电话会议主持人的位置还包括电子地
识别所述电话会议主持人相对于所述电话会议电话的位置。

在一个实施例中，确定所识别的电话会议主持人的位置还包括使用所
述电话会议主持人的语音识别来确定所述电话会议主持人相对于所述电话
会议电话的位置。

在一个实施例中，将所述电话会议电话上的所述多个麦克风配置为波
束成形接收器还包括对所述多个麦克风中的每个麦克风应用有限脉冲响应
滤波器来形成空间滤波器。

在一个实施例中，偏置所述多个麦克风还包括增大麦克风的灵敏度来
增大对从所述位置接收的音频信号的接收。

在一个实施例中，偏置所述多个麦克风还包括手动调节麦克风的灵敏
度来调节对从所述位置接收的音频信号的接收的灵敏度。

在一个实施例中，偏置所述多个麦克风还包括减小麦克风的灵敏度来
减小对从除所述位置以外的其它方向接收的背景噪声的接收。

附图说明

本发明的特征和优点将从以下详细描述中变得明显，该详细描述结合
附图进行，所述附图一起通过示例方式图示了本发明的特征，并且，在附
图中：

图1图示出根据本发明一个实施例的电话会议扬声器电话的示例示图；

图2图示出根据本发明一个实施例的具有八个麦克风的电话会议扬声
器的示例；

图3图示出根据本发明的实施例的具有多个区间的电话会议扬声器电
话的示例；

图4图示出根据本发明实施例的用于在电话会议电话上接收来自电话
会议主持人的声音的系统的示例性框图；以及

图5图示出根据本发明实施例的用于在电话会议电话上接收来自电话
会议主持人的声音的方法的流程图。

现在将参考所图示的示例性实施例，并且，在此将使用具体的语言来
描述示例性实施例。然而，将理解，不意图对本发明的范围的任何限制。

具体实施方式

定义

这里所使用的术语“实质上”(substantially)是指动作、特征、属性、
状态、结构、项目或结果的完全或接近完全的范围或程度。例如，“实质
上”被包围的物体意味着该物体或者完全被包围或者几乎完全被包围。偏
离绝对完全的准确容许度在一些情况中可以取决于具体上下文。然而，一
般而言，接近完全也将像获得绝对的全部的完全一样具有相同的总体结果。
“实质上”的使用等同地适用于在用来指完全或接近完全缺少动作、特征、
属性、状态、结果、项目或结果的否定含义中使用。

示例实施例

以下提供技术实施例的初始概览，并且随后，更详细地描述具体的技
术实施例。该初始概要意图帮助读者更快地理解技术，而不是意图标识技
术的关键特征或必不可少的特征，也不意图限制要求保护的主题的范围。
为了以下所述的概览和实施例的清楚起见，提供以下定义。

为了拾取特定方向上的声音，会议扬声器电话(在此称为会议电话)
可以被配置为使用波束成形算法来操作。波束成形算法可以与被设计用于
在特定方向上发送射频信号的波束成形算法类似地起作用。波束成形算法
也被用在音频扬声器阵列中来在特定方向上发送音频。然而，会议电话中
使用的波束成形算法被用于将多个麦克风配置为接收音频信号，而不是发
送射频信号或音频信号。

典型的波束成形算法连续地分析位于会议电话中的麦克风阵列中的麦
克风的音频输入电平来判断哪个麦克风接收最高幅度的音频信号。接收最
高幅度的音频信号的麦克风通常是离会议电话处接收的最大声音频源最近
和/或指向该最大声音频源的麦克风。此信息被用来将该麦克风配置为从最
大声音频源方向接收音频。该阵列的麦克风被配置为接收和放大来自此方
向的声音，同时衰减来自其它方向的声音。

会议呼叫通常由主持人运行，主持人例如是召开该会议的人。在许多
情况中，当他们在会议呼叫期间讲话时，该人应当比房间内的其它参与者
具有更高的优先级。例如，会议可以由高级管理人以及房间内作为该管理
人的下属的其他参与者主持。根据本发明的一个实施例，可能期望高级管
理人相比于电话会议的其他人被给与更高的优先级。相应地，会议扬声器
电话中的麦克风可以被配置为集中在该高级管理人，而不论他或她在电话
会议期间是否讲话。这将使得电话会议中处于电话呼叫的另一端的(一个
或多个)参与者可以听到该高级管理人，即便处于高级管理人的位置处的
另一个人比高级管理人更大声地讲话也是如此。

根据本发明的一个实施例，会议扬声器电话被配置为使得用户可以识
别会议呼叫主持人。一旦被识别，则对来自会议呼叫主持人方向的音频的
接收可以优先于从其它方向接收的音频。从会议呼叫主持人的方向接收的
音频可以相比于波束成型算法中的其它音频波束被给与更高的优先级以使
得电话呼叫另一端处的参与者可以听到会议呼叫主持人而越过其它参与
者。当会议呼叫主持人不是正在通信时，则会议扬声器电话可以被配置为
从位于会议电话周围的其它参与者接收音频。

图1提供会议扬声器电话100的一个示例。在此示例中，会议扬声器
电话实质上是圆的，其中多个麦克风排列在围绕中央扬声器102的环中。
电话包括环绕扬声器102的光棒106。光棒被分割成多个区间，每个区间表
示音频方向，麦克风被配置为从这些音频方向接收音频。在此示例中，存
在6个不同的区间。光棒的每个区间可以在麦克风被配置为接收该区间的
方向上的音频时被各自点亮，从而显示多个麦克风被配置为定向地接收波
束成形音频信号的方向。

尽管图1中示出的会议扬声器电话是圆的，但是在本申请的范围内也
考虑另外的形状。例如，会议扬声器电话可以具有三个、四个、六个或更
多从中央扬声器指向外面的臂，每个臂允许声音在臂的反向上被定向地接
收。会议扬声器电话可以被塑形为椭圆形、正方形、长方形、五角形、六
边形、七边形、八边形等等。会议扬声器电话可以具有使得多个麦克风能
够被定向来从多个方向接收音频的任何形状。麦克风也可以被配置为最小
化来自其它方向的声音。在一个实施例中，会议扬声器电话可以被塑形为
在围绕会议电话的360度上接收音频。

如之前讨论的，会议扬声器电话通常被配置为接收从具有最大声音频
的方向接收声音。因此，如果扬声器(或背景噪声)在关于特定区间的方
向上是最大声的，则光棒106的相关联的区间将发光，并且，会议电话中
的麦克风被配置为在该区间的方向上接收音频。在一个实施例中，会议电
话中的某些麦克风的增益可以被增强，同时其它(一个或多个)麦克风的
增益可以被减小以降低背景噪声。

各种不同类型的波束成形算法可以被用来将扬声器电话中的麦克风配
置为接收和放大特定方向上的声音。波束成形是其中来自多个麦克风的信
号在幅度和相位上被调节以或者放大或者衰减接收到的音频信号的信号处
理技术。波束成形可以利用有相长干涉或相消干涉来改变会议电话中的固
定麦克风阵列的方向性。

一个简化示例在图2中示出。在此示例中，图示出具有八个麦克风204
的会议扬声器电话202。会议电话202可以实际上具有数十个或甚至数百个
分离的麦克风。从选定方向发射的声波206将首先被与音频源最接近的麦
克风接收到。声波可以是由讲话的人发射的音频。在此示例中，声波将首
先被麦克风1接收到。声波将继续前进。假定声波继续，其随后将被麦克
风2和8检测到，然后被麦克风3和7检测到，然后被6和4检测到，最
后被麦克风5检测到。因此，由每个麦克风创建的与被检测声波对应的电
信号将在不同的时间被创建。为了放大声波206，每个麦克风的相位可以被
调节以使得信号可以被组合。当信号实质上是同相的时，检测到的信号将
被相长地相加，使得被检测声波206被放大。

背景噪声可以在会议电话202处由麦克风204从其它方向接收。例如，
声波208可以是背景噪声。背景噪声可以具有比声波206低的幅度。背景
噪声也将被每个麦克风顺次检测到。与背景噪声相关联的麦克风信号的相
位可以被调节成是异相的。例如，麦克风可以被调节以使得它们是180度
异相的。异相的信号随后可以被相加，从而导致背景噪声声波208的幅度
明显下降的相消干涉。

除了调节由每个麦克风204检测到的信号的相位以外，每个麦克风的
增益(信号放大)也可以被调节。例如，当检测到具有最大幅度的音频时，
该区域中的麦克风的增益可以被增大。类似地，在会议电话202的相反侧
上的麦克风的增益可以被减小。

会议电话202可以包括微处理器，诸如现场可编程门阵列(FPGA)、
数字信号处理器(DSP)或类似类型的处理器。在此示例中使用DSP 210。
每个麦克风的输出可以(使用模拟到数字转换器)被转换成数字信号并被
发送给DSP 210。DSP可以使用波束成形算法来更改来自麦克风的数字信
号以形成空间滤波器使得来自选定方向的声音被放大，同时来自其它方向
的声音被衰减。通常类型的波束成形算法包括延迟和加和波束成形算法、
巴特利特波束成形算法、超方向性波束成形算法、最小平方波束成形算法
和最小方差无畸变响应(MVDR)波束成形算法。可以使用能够使得能够
检测到并放大来自选定方向的声音同时最小化来自其它不想要的方向的声
音的任何类型的波束成形算法。

如之前所讨论的，使用会议扬声器电话的挑战之一在于在使得多方能
够讲话的同时最小化背景噪声。例如，如果一个人正在演示，并且，会议
电话被定向为检测来自该演示的音频，则坐在会议电话周围的另一位置处
的发表评论或提问题的另一个人可能不会被会议电话检测到。更具体而言，
会议电话可能最小化由第二扬声器输出的音频，假定其是背景噪声。因此，
电话呼叫另一侧的(一个或多个)人可能无法听到讲话的第二个人。这在
第二个人是电话会议主席或另一高级人员的情况中特别具有挑战性。

为了克服这些限制，会议呼叫主席人员相对于会议扬声器电话的位置
可以被识别。会议扬声器电话随后可以被配置为检测来自会议主席方向的
音频，即便另一个人正在更大声地讲话。这使得会议主席能够在会议呼叫
的任何时间点添加能够被电话呼叫的另一端的(一个或多个)人听到的输
入。

存在识别会议呼叫主席相对于会议扬声器电话的位置的许多不同方
式。在一个实施例中，会议电话可以包括可被配置为接收来自电话会议主
持人的音频的选定位置。例如，图1中的会议电话100中的六个区间中的
一个可以被配置成被设置为接收来自电话会议主持人的音频。该选择可以
称作主持人区间。电话会议主持人可以旋转电话使得主持人区间指向主持
会议呼叫的人。

会议电话100可以被配置为允许主持人激活或撤消“主持人模式”，
在该模式中，主持人区间被配置为检测比选定阈值更大的来自主持人区间
的方向的音频。该阈值可以被设置使得其大约等于来自电话会议主持人的
典型语音会话幅度。该阈值可以是工厂设置的或可以是可由用户调节的。
电话会议主持人可以经由会议电话上的按钮或图形用户界面或经由与会议
电话通信的计算设备来激活“主持人模式”。

当主持人模式被激活时，随后可以在主持人区间的方向上检测大于选
定阈值的音频。该音频可以经由电话呼叫被放大和传送。在一个实施例中，
当主持人模式被激活并检测到来自主持人区间的方向的具有在选定阈值电
平以上的幅度的音频时，会议电话可以被配置为接收来自此方向的音频，
同时最小化从任何其它方向接收的音频。到达电话呼叫的另一侧的(一个
或多个)人的结果将是：每当指定的电话会议主持人讲话时，第一扬声器
就被中断。

可替换地，会议电话可以被配置为继续接收来自第一扬声器的音频或
来自第一方向的音频，并且，当主持人模式被激活且来自主持人方向的音
频幅度大于选定阈值时，加上从主持人区间的方向接收的音频。这可以导
致在电话呼叫另一侧的(一个或多个)人能够同时听到第一扬声器(和/或
来自第一方向的音频)和主持人扬声器(和/或来自电话会议主持人的方向
的音频)二者，如同这(一个或多个)人物理地出现在会议电话的位置处
那样发生。

在另一实施例中，电话会议主持人的方向可以被电子地识别。不是使
用被配置为提供单个方向上的主持人模式的电话会议扬声器电话，而是用
户或主持人可以电子地识别主持人相对于会议电话的位置。例如，会议电
话可以被配置为使得用户能够按压会议电话上的按钮来识别主持人的位
置。可替换地，会议电话可以显示图形用户界面或与图形用户界面电子地
连接，该图形用户界面可以被配置用于选择主持人相对于会议电话将位于
的方向。当主持人模式被激活时，会议电话随后可以被配置为使从电话会
议主持人的方向检测到的音频优先，如以上所讨论的。

在另一实施例中，电话会议主持人相对于会议电话的位置可以被动态
地确定。动态地确定电话会议主持人的位置的能力提供许多优点。可以允
许电话会议主持人在电话呼叫期间到处移动。例如，电话会议主持人可以
从桌边的座位发起会议呼叫。电话会议主持人随后可以移动到会议室中的
白板或另一位置处。会议电话可以被配置只要电话会议主持人一讲话就识
别并使得从电话会议主持人的方向检测到的音频优先，如以上所讨论的。

电话会议主持人相对于会议电话的位置可以以许多不同的方式被动态
地确定。例如，在一个实施例中，会议电话主持人的位置可以基于语音识
别被确定。电话会议主持人可以提供语音样本给会议电话。语音样本可以
被用来识别电话会议主持人讲话的时间。电话会议主持人的位置可以基于
哪些麦克风最先检测到来自电话会议主持人的音频来确定。当电话会议主
持人的位置改变时，会议电话可以被配置为提供对来自更新后的会议电话
位置的音频的优先检测。

在另一实施例中，会议电话主持人可以使用经由有线或无线连接耦合
到会议电话的便携式麦克风。无线连接可以经由诸如蓝、IEEE 802.11、
DECT等的工业标准来实现。便携式麦克风可以用来不仅在电话会议主持人
在房间内移动时接收来自电话会议主持人的音频，还可以用来确定电话会
议主持人相对于会议电话的距离。如以上所讨论的，会议电话主持人的位
置可以基于哪些麦克风最先检测到音频来确定。

例如，电话会议主持人相对于会议电话的距离可以基于在便携式麦克
风处接收的音频相对于在会议电话处的第一麦克风处接收的音频的时间差
来确定。便携式麦克风处的声音被转换成电信号并且经由有线或无线信号
被传送至会议电话。有线或无线信号将以接近光速传送。然而，来自电话
会议主持人的音频信号将以声速传送到会议电话处的麦克风。无线信号的
接收相对于较慢的音频信号的接收的定时差可以被用来确定电话会议主持
人的距离。关于电话会议主持人距离会议电话的距离获得的信息可以随后
被用来调节麦克风在定向地接收来自电话会议主持人的音频时的增益和/或
灵敏度。这将在以下更全面地讨论。

会议电话的主持人模式

为了在具有多个麦克风的会议电话中实现主持人模式，这些麦克风中
的一个或多个麦克风的增益可以关于电话会议主持人的方向被调节。这可
以使用模拟电路或数字电路来实现。

在一个示例性实施例中，会议电话可以被分割成区间，如图3所示。
图3示出被分割成6个区间的会议电话。会议电话可以具有比6个区间更
多或更少的区间。每个区间可以包括一个或多个麦克风。每个麦克风可以
连接到DSP或等同物。还可以包括另外的电子电路，诸如用来调节每个麦
克风的输出的增益的放大器。放大器的输出可以被发送给模拟转数字转换
器，其随后可以被发送给DSP。每个麦克风的输出可以使用波束成形算法
被调节，诸如如下等式：

BF 1 ( t ) = Σ i = 1 N ( h ‾ 1 i * x ‾ 1 i ) ( t ) ]]>

BF 2 ( t ) = Σ i = 1 N ( h ‾ 2 i * x ‾ 2 i ) ( t ) - - - ( 1 ) ]]>

…

BF 6 ( t ) = Σ i = 1 N ( h ‾ 6 i * x ‾ 6 i ) ( t ) ]]>

其中，t是时间，N是数字滤波器的系数数目，h1i是用于第一区间中的
麦克风的时域中的数字滤波器系数，并且x1i是来自第一区间的麦克风的信
号。如等式1中所示，可以针对会议电话的每个区间中的每个麦克风进行
计算。在一个实施例中，诸如有限脉冲响应(FIR)滤波器之类的数字滤波
器可以被用来对进入信号滤波器系数加权来创建用于放大期望的音频信号
并衰减不期望的音频信号的空间滤波器，如之前所讨论的。以上示例不意
图是限制性的。存在可以用来对麦克风进行空间滤波以在会议电话处获得
期望音频信号的许多算法和滤波手段。在期望的音频信号已经被获得时，
其可以经由公共交换电话网络(PSTN)或经由诸如因特网协议上的语音
(VoIP)信号的数字化信号或其他类型的基于分组的通信而被发送给一方
或多方。

根据一个实施例，“主持人模式”可以通过对如图3中所示的会议电
话的每个区间中的麦克风的系数值进行加权来实现。例如，权重值“w”可
以被用来导致对由会议电话的某一区间中的麦克风接收的音频的优先对
待。因此，等式1变为如下等式1’：

BF 1 ( t ) = w 1 Σ i = 1 N ( h ‾ 1 i * x ‾ 1 i ) ( t ) ]]>

BF 2 ( t ) = w 2 Σ i = 1 N ( h ‾ 2 i * x ‾ 2 i ) ( t ) - - - ( 1 , ) ]]>

…

BF 6 ( t ) = w 6 Σ i = 1 N ( h ‾ 6 i * x ‾ 6 i ) ( t ) ]]>

每个区间中的权重的权重值一开始可以被设置成选定的单一值以对每
个区间提供均等的加权。在一个示例中，权重值“w”可以被默认设置成一
(1)。

区间中的一个随后可以被识别为是最接近电话会议主持人的，从而被
指定为主持人模式区间。随后，可以基于因子数相对于其它区间中的加权
因子来增大主持人模式区间的权重。一个因子是音频将被检测到并经由会
议呼叫被传送的预定音频阈值。增大的权重值“w”可以使得具有较低幅度
的音频能够被检测到。

在一个实施例中，用于主持人模式区间的加权因子可以被手动地控制。
加权因子可以使用位于会议电话上的物理控件来手动控制，所述控件例如
是音量加大和音量减小按钮、滑动控件、与会议电话通信的图形用户接口
控件等等。如果电话会议主持人走到离会议电话更远的地方，则需要增大
权重值以允许更低幅度的音频被检测到。当电话会议主持人走到离会议电
话更近的地方，则需要减小权重值以使得电话会议主持人方向上的不注意
的背景噪声不被检测到和发送。

在另一实施例中，用于主持人模式区间的加权因子可以通过检测电话
会议主持人离会议电话的距离(如以上讨论的)并基于距离调节加权因子
而被自动控制。可替换地，基于电话会议主持人离会议电话的距离以及诸
如背景噪声量的其它因子的自动调节的组合可以与手动调节用于主持人区
间的加权因子的能力组合。

另外，其它区间中的麦克风的加权因子也可以按照期望被增大或减
小。例如，如果在一个方向上存在相对高的背景噪声电平，则用于该方向
上的一个或多个区间的加权因子可以被减小为小于1，从而衰减从该方向接
收的声音。

在另一实施例中，公开了也能够与在电话会议电话上接收来自电话会
议主持人的声音的系统400，如图4中提供的示例框图所示。框图不是按比
例绘制的。

系统400包括电话会议电话402，其具有多个麦克风404，麦克风404
被配置为用于接收来自选定方向的音频信号的波束成形接收器。方向识别
模块406被电子地耦合到电话会议电话以允许用户识别所要识别的电话会
议主持人408相对于电话会议电话的方向。电话会议主持人可以是被选定
来主持电话会议呼叫的任何人。电话会议主持人相对于电话会议电话的方
向可以通过物理地移动电话会议电话、电子地选择电话会议电话上靠近电
话会议主持人的位置或电子地识别电话会议主持人相对于电话会议电话上
的麦克风的位置而被识别，如以上所讨论的。

方向偏置模块410被配置为偏置多个麦克风404中的选定麦克风来相
对于来自其它方向的音频接收来自从所识别的电话会议主持人408的方向
的音频信号。在该示例中，电话会议主持人408位于相对于电话会议电话
402的麦克风的方向上。麦克风402可以被配置为接收来自电话会议主持人
的方向的音频。选定麦克风可以通过将麦克风加权成更灵敏或不那么灵敏
(如以上所讨论的)而被偏置。这使得无论何时只要电话会议主持人发言
或产生其它类型的音频时来自电话会议主持人的方向的音频都能够被选择
并经由会议电话被传送，从而使得电话会议主持人能够控制该会议。

尽管会议电话402被配置为被偏置以接收来自电话会议主持人的方向
的音频，但是其通常不被配置为在其它方向上被偏置。例如，当电话会议
的参加者412想要讲话时，他或她必须等待其它每个人停止讲话以便被会
议电话检测到。然而，到这发生时，参加者的评论可能不再是相关的。相
应地，会议电话还可以包括评论按钮414。评论按钮可以是任何物理按钮或
开关，或由与电话会议电话通信的图形用户界面提供的虚拟按钮。

评论按钮414可以产生用来指示有人有评论或问题的时间的音频铃声。
音频铃声可以告知讲话者和/或电话会议主持人有人有问题。扬声器和电话
会议主持人随后可以允许参加者412问问题。如果没有其他人(包括主持
人408)正在讲话，则会议电话被配置为接收来自另一讲话者(诸如参见者
412)的音频。来自参见者412的音频随后将被传送给电话会议中所涉及的
其它方，从而使得参加者能够及时评论或提问。

在另一实施例中，公开了用于在电话会议电话处接收来自电话会议主
持人的声音的方法，如图5的流程图中所示。该方法包括识别510充当电
话会议主持人的人。可以相对于电话会议电话来确定520所识别的电话会
议主持人的位置。电话会议电话上的多个麦克风被配置530成无论何时只
要来自电话会议主持人的位置的音频信号具有大于预定阈值电平的幅度时
就接收来自该位置的音频的波束成形接收器。多个麦克风中的选定麦克风
被偏置540来相对于来自相对于电话会议电话的其它方向的声音接收来自
电话会议主持人的声音。

如之前所讨论的，识别电话会议主持人的位置可以包括在会议电话上
的预定位置物理地移动到朝向电话会议主持人的方向。可替换地，所识别
的电话会议主持人相对于会议电话的位置可以被电子地识别。例如。按钮、
滑块或图形用户界面可被用来电子地识别电话会议主持人相对于电话会议
电话的位置。在另一实施例中，如之前所讨论的，所识别的电话会议主持
人的位置可以使用语音识别来确定。

应当理解，所公开的本发明的实施例不限于在此公开的特定结构、处
理步骤或材料，而是可以扩展到本领域普通技术人员将认识到的等同物。
还应当理解，在此采用的术语仅用于描述具体实施例的用途并且不意图是
限制性的。

各种技术或其某些方面或部分可以采用有形介质中包含的程序代码
(指令)的形式，有形介质诸如是软碟、CD-ROM、硬驱或任何其它机器
可读的存储介质，其中当程序代码被加载到诸如计算机之类的机器中并被
机器运行时，机器变成用于实行各种技术的装置。在可编程计算机上的程
序代码运行的情况中，计算设备可以包括处理器、处理器可读的存储介质
(包括易失性和非易失性的存储器和/或存储元件)、至少一个输入设备以
及至少一个输出设备。可以实现或利用在此所述的各种技术的一个或多个
程序可以使用应用编程接口(API)、可重用控件等。这样的程序可以以高
级的面向程序或面向对象的编程语言来实现以与计算机系统通信。然而，
(一个或多个)程序可以以汇编或机器语言实现，如果期望的话。在任何
情况中，语言可以是已编译或已解释的语言，并且可以与硬件实现相结合。

贯穿该说明书中对“一个实施例”或“实施例”的提及意味着结合实
施例描述的特定特征、结构或特点被包括在本发明的至少一个实施例中。
因此，贯穿该说明书的各个地方出现的短语“在一个实施例中”或“在实
施例中”不一定都指同一实施例。

为了方便，这里使用的多个项目、结构元素、组成元素和/或材料可以
呈现在共同的列表中。然而，这些列表应当像列表中的每个成员被单独地
识别为分离的特有的成员那样去理解。因此，在单单基于列表中的各个成
员在公共群组中的表示并且没有相反的指示的情况下，这样的列表中的个
别的成员不应当理解为同一列表中的任何其它成员的实际等同物。另外，
在可以参考本发明的各个实施例和示例以及其各个组件的替换物。应当理
解，这样的实施例、示例和替换例不应被理解成另一个的实际等同物，而
是应当理解为是本发明的分离和自主的表示。

此外，在一个或多个实施例中，所描述的特征、结果或特点可以以任
何适当的方式被组合。在以下描述中，诸如长度、宽度、形状等的示例之
类的各种具体细节被提供，以提供对本发明的实施例的透彻理解。然而，
本领域技术人员将认识到本发明可以在没有这些具体细节中的一个或多个
的情况下或利用其它方法、组件、材料等来实行。在其它实例中，公知的
结构、材料或操作未被详细示出或描述以避免模糊本发明的方面。

尽管以上示例在在一个或多个具体应用中说明本发明的原理，但是对
于本领域技术人员显然的是，在不偏离本发明的原理和改变并且没有实行
创造性能力的情况下可以对实现方式的形式、使用和细节做许多修改。相
应地，不意图本发明被限制，除了如权利要求所述那样受限制以外。

资源描述

《音频会议电话的主持人模式.pdf》由会员分享，可在线阅读，更多相关《音频会议电话的主持人模式.pdf（16页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102685339 A (43)申请公布日 2012.09.19 C N 1 0 2 6 8 5 3 3 9 A *CN102685339A* (21)申请号 201210059274.9 (22)申请日 2012.03.02 12/932,764 2011.03.04 US H04M 3/56(2006.01) H04R 1/20(2006.01) (71)申请人米特尔网络公司地址加拿大安大略省 (72)发明人彼得库斯吴安杰 (74)专利代理机构北京东方亿思知识产权代理有限责任公司 11258 代理人宋鹤 (54) 发明名称音频会议电话的主持人模式 (57)。

2、摘要本发明公开了音频会议电话的主持人模式。公开了用于在电话会议电话处接收来自电话会议主持人的声音的系统和方法。该方法包括识别充当电话会议主持人的人。确定所识别的电话会议主持人相对于电话会议电话的位置。将电话会议电话上的多个麦克风配置为波束成形接收器，以用于接收来自电话会议主持人的位置的音频信号。偏置多个麦克风中的选定麦克风以相对于从其它方向接收的声音来接收来自电话会议主持人的方向的声音。 (30)优先权数据 (51)Int.Cl. 权利要求书1页说明书9页附图5页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 1 页说明书 9 页附图 5。

3、页 1/1页 2 1.一种用于在电话会议电话处接收来自电话会议主持人的声音的方法，包括：识别充当所述电话会议主持人的人；确定所识别的电话会议主持人相对于所述电话会议电话的位置；将所述电话会议电话上的多个麦克风配置为波束成形接收器，以用于每当来自所述电话会议主持人的位置的音频信号的幅度大于预定阈值电平时就接收来自所述位置的所述音频信号；以及偏置所述多个麦克风中的选定麦克风以相对于从相对于所述电话会议电话的其它方向接收的声音来接收来自所述电话会议主持人的方向的声音。 2.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括将所述电话会议电话上的预定位置物理地移动到。

4、朝向所述电话会议主持人的方向。 3.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括电子地识别所述电话会议主持人相对于所述电话会议电话的位置。 4.如权利要求1所述的方法，其中，确定所识别的电话会议主持人的位置还包括使用所述电话会议主持人的语音识别来确定所述电话会议主持人相对于所述电话会议电话的位置。 5.如权利要求1所述的方法，其中，将所述电话会议电话上的所述多个麦克风配置为波束成形接收器还包括对所述多个麦克风中的每个麦克风应用有限脉冲响应滤波器来形成空间滤波器。 6.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括增大麦克风的灵敏度来增大对从所述位置接。

5、收的音频信号的接收。 7.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括手动调节麦克风的灵敏度来调节对从所述位置接收的音频信号的接收的灵敏度。 8.如权利要求1所述的方法，其中，偏置所述多个麦克风还包括减小麦克风的灵敏度来减小对从除所述位置以外的其它方向接收的背景噪声的接收。权利要求书CN 102685339 A 1/9页 3 音频会议电话的主持人模式技术领域 0001 本发明涉及音频会议电话。背景技术 0002 会议扬声器电话(通常称作会议电话)是用来使得房间内的若干人可以与另一地点的人通信的专用电话。会议电话通常没有电话听筒。而是，会议电话通常包括单个扬声器和。

6、能够接收环绕会议电话360度的音频的许多麦克风，使得处在会议电话周围的多个人能够经由会议电话通信。 0003 会议电话共同的问题在于当在房间内存在背景噪声时拾取(pick up)谁正在讲话的能力。背景噪声可能使得很难听到离会议电话最远的那些人的发言。为了帮助解决此问题，已经设计了这样的会议电话，其具有的麦克风具备被配置为通过使用波束成形 (beamforming)来接收特定方向上的音频的能力，波束成形集中(focus)麦克风在选定方向上接收的音频。 0004 例如，会议电话中的麦克风可以被配置为接收说话最大声的人的音频，同时衰减由定向在房间内其它方向上的麦克风所接收的声音。这可以在最。

7、大化讲话的人的音频接收的同时最小化背景噪声的拾取。位于电话连接的另一端(即，其它地点)的正在接收来自该会议呼叫的音频的人主要听到带有有限背景噪声的扬声器。 0005 将麦克风集中于从讲话最大声的人接收音频同时减少背景噪声的接收使得位于其它地点的那些人能够听到人讲话。然而，其并不对谁讲话布置任何优先级。每个人都被平等对待。这使得当电话会议的主持人讲话时，她或他很难被听到，从而降低了电话呼叫的有效性。发明内容 0006 根据本发明的一个方面，提供一种用于在电话会议电话处接收来自电话会议主持人的声音的方法，包括：识别充当所述电话会议主持人的人；确定所识别的电话会议主持人相对于所述电话。

8、会议电话的位置；将所述电话会议电话上的多个麦克风配置为波束成形接收器，以用于每当来自所述电话会议主持人的位置的音频信号的幅度大于预定阈值电平时就接收来自所述位置的所述音频信号；以及偏置所述多个麦克风中的选定麦克风以相对于从相对于所述电话会议电话的其它方向接收的声音来接收来自所述电话会议主持人的方向的声音。 0007 在一个实施例中，确定所识别的电话会议主持人的位置还包括将所述电话会议电话上的预定位置物理地移动到朝向所述电话会议主持人的方向。 0008 在一个实施例中，确定所识别的电话会议主持人的位置还包括电子地识别所述电话会议主持人相对于所述电话会议电话的位置。 0009 在一个实。

9、施例中，确定所识别的电话会议主持人的位置还包括使用所述电话会议主持人的语音识别来确定所述电话会议主持人相对于所述电话会议电话的位置。说明书CN 102685339 A 2/9页 4 0010 在一个实施例中，将所述电话会议电话上的所述多个麦克风配置为波束成形接收器还包括对所述多个麦克风中的每个麦克风应用有限脉冲响应滤波器来形成空间滤波器。 0011 在一个实施例中，偏置所述多个麦克风还包括增大麦克风的灵敏度来增大对从所述位置接收的音频信号的接收。 0012 在一个实施例中，偏置所述多个麦克风还包括手动调节麦克风的灵敏度来调节对从所述位置接收的音频信号的接收的灵敏度。 0013 在。

10、一个实施例中，偏置所述多个麦克风还包括减小麦克风的灵敏度来减小对从除所述位置以外的其它方向接收的背景噪声的接收。附图说明 0014 本发明的特征和优点将从以下详细描述中变得明显，该详细描述结合附图进行，所述附图一起通过示例方式图示了本发明的特征，并且，在附图中： 0015 图1图示出根据本发明一个实施例的电话会议扬声器电话的示例示图； 0016 图2图示出根据本发明一个实施例的具有八个麦克风的电话会议扬声器的示例； 0017 图3图示出根据本发明的实施例的具有多个区间的电话会议扬声器电话的示例； 0018 图4图示出根据本发明实施例的用于在电话会议电话上接收来自电话会议主持人的声音的系。

11、统的示例性框图；以及 0019 图5图示出根据本发明实施例的用于在电话会议电话上接收来自电话会议主持人的声音的方法的流程图。 0020 现在将参考所图示的示例性实施例，并且，在此将使用具体的语言来描述示例性实施例。然而，将理解，不意图对本发明的范围的任何限制。具体实施方式 0021 定义 0022 这里所使用的术语“实质上”(substantially)是指动作、特征、属性、状态、结构、项目或结果的完全或接近完全的范围或程度。例如，“实质上”被包围的物体意味着该物体或者完全被包围或者几乎完全被包围。偏离绝对完全的准确容许度在一些情况中可以取决于具体上下文。然而，一般而言，接近完全也。

12、将像获得绝对的全部的完全一样具有相同的总体结果。“实质上”的使用等同地适用于在用来指完全或接近完全缺少动作、特征、属性、状态、结果、项目或结果的否定含义中使用。 0023 示例实施例 0024 以下提供技术实施例的初始概览，并且随后，更详细地描述具体的技术实施例。该初始概要意图帮助读者更快地理解技术，而不是意图标识技术的关键特征或必不可少的特征，也不意图限制要求保护的主题的范围。为了以下所述的概览和实施例的清楚起见，提供以下定义。 0025 为了拾取特定方向上的声音，会议扬声器电话(在此称为会议电话)可以被配置为使用波束成形算法来操作。波束成形算法可以与被设计用于在特定方向上发送射。

13、频信号的波束成形算法类似地起作用。波束成形算法也被用在音频扬声器阵列中来在特定方向上发送音频。然而，会议电话中使用的波束成形算法被用于将多个麦克风配置为接收音频信说明书CN 102685339 A 3/9页 5 号，而不是发送射频信号或音频信号。 0026 典型的波束成形算法连续地分析位于会议电话中的麦克风阵列中的麦克风的音频输入电平来判断哪个麦克风接收最高幅度的音频信号。接收最高幅度的音频信号的麦克风通常是离会议电话处接收的最大声音频源最近和/或指向该最大声音频源的麦克风。此信息被用来将该麦克风配置为从最大声音频源方向接收音频。该阵列的麦克风被配置为接收和放大来自此方向的声。

14、音，同时衰减来自其它方向的声音。 0027 会议呼叫通常由主持人运行，主持人例如是召开该会议的人。在许多情况中，当他们在会议呼叫期间讲话时，该人应当比房间内的其它参与者具有更高的优先级。例如，会议可以由高级管理人以及房间内作为该管理人的下属的其他参与者主持。根据本发明的一个实施例，可能期望高级管理人相比于电话会议的其他人被给与更高的优先级。相应地，会议扬声器电话中的麦克风可以被配置为集中在该高级管理人，而不论他或她在电话会议期间是否讲话。这将使得电话会议中处于电话呼叫的另一端的(一个或多个)参与者可以听到该高级管理人，即便处于高级管理人的位置处的另一个人比高级管理人更大声地讲话也是。

15、如此。 0028 根据本发明的一个实施例，会议扬声器电话被配置为使得用户可以识别会议呼叫主持人。一旦被识别，则对来自会议呼叫主持人方向的音频的接收可以优先于从其它方向接收的音频。从会议呼叫主持人的方向接收的音频可以相比于波束成型算法中的其它音频波束被给与更高的优先级以使得电话呼叫另一端处的参与者可以听到会议呼叫主持人而越过其它参与者。当会议呼叫主持人不是正在通信时，则会议扬声器电话可以被配置为从位于会议电话周围的其它参与者接收音频。 0029 图1提供会议扬声器电话100的一个示例。在此示例中，会议扬声器电话实质上是圆的，其中多个麦克风排列在围绕中央扬声器102的环中。电话包括环。

16、绕扬声器102的光棒106。光棒被分割成多个区间，每个区间表示音频方向，麦克风被配置为从这些音频方向接收音频。在此示例中，存在6个不同的区间。光棒的每个区间可以在麦克风被配置为接收该区间的方向上的音频时被各自点亮，从而显示多个麦克风被配置为定向地接收波束成形音频信号的方向。 0030 尽管图1中示出的会议扬声器电话是圆的，但是在本申请的范围内也考虑另外的形状。例如，会议扬声器电话可以具有三个、四个、六个或更多从中央扬声器指向外面的臂，每个臂允许声音在臂的反向上被定向地接收。会议扬声器电话可以被塑形为椭圆形、正方形、长方形、五角形、六边形、七边形、八边形等等。会议扬声器电话可以具有。

17、使得多个麦克风能够被定向来从多个方向接收音频的任何形状。麦克风也可以被配置为最小化来自其它方向的声音。在一个实施例中，会议扬声器电话可以被塑形为在围绕会议电话的360度上接收音频。 0031 如之前讨论的，会议扬声器电话通常被配置为接收从具有最大声音频的方向接收声音。因此，如果扬声器(或背景噪声)在关于特定区间的方向上是最大声的，则光棒106 的相关联的区间将发光，并且，会议电话中的麦克风被配置为在该区间的方向上接收音频。在一个实施例中，会议电话中的某些麦克风的增益可以被增强，同时其它(一个或多个)麦克风的增益可以被减小以降低背景噪声。 0032 各种不同类型的波束成形算法可以被用。

18、来将扬声器电话中的麦克风配置为接收说明书CN 102685339 A 4/9页 6 和放大特定方向上的声音。波束成形是其中来自多个麦克风的信号在幅度和相位上被调节以或者放大或者衰减接收到的音频信号的信号处理技术。波束成形可以利用有相长干涉或相消干涉来改变会议电话中的固定麦克风阵列的方向性。 0033 一个简化示例在图2中示出。在此示例中，图示出具有八个麦克风204的会议扬声器电话202。会议电话202可以实际上具有数十个或甚至数百个分离的麦克风。从选定方向发射的声波206将首先被与音频源最接近的麦克风接收到。声波可以是由讲话的人发射的音频。在此示例中，声波将首先被麦克风1接收到。

19、。声波将继续前进。假定声波继续，其随后将被麦克风2和8检测到，然后被麦克风3和7检测到，然后被6和4检测到，最后被麦克风5检测到。因此，由每个麦克风创建的与被检测声波对应的电信号将在不同的时间被创建。为了放大声波206，每个麦克风的相位可以被调节以使得信号可以被组合。当信号实质上是同相的时，检测到的信号将被相长地相加，使得被检测声波206被放大。 0034 背景噪声可以在会议电话202处由麦克风204从其它方向接收。例如，声波208 可以是背景噪声。背景噪声可以具有比声波206低的幅度。背景噪声也将被每个麦克风顺次检测到。与背景噪声相关联的麦克风信号的相位可以被调节成是异相的。例如，。

20、麦克风可以被调节以使得它们是180度异相的。异相的信号随后可以被相加，从而导致背景噪声声波208的幅度明显下降的相消干涉。 0035 除了调节由每个麦克风204检测到的信号的相位以外，每个麦克风的增益(信号放大)也可以被调节。例如，当检测到具有最大幅度的音频时，该区域中的麦克风的增益可以被增大。类似地，在会议电话202的相反侧上的麦克风的增益可以被减小。 0036 会议电话202可以包括微处理器，诸如现场可编程门阵列(FPGA)、数字信号处理器(DSP)或类似类型的处理器。在此示例中使用DSP 210。每个麦克风的输出可以(使用模拟到数字转换器)被转换成数字信号并被发送给DSP 2。

21、10。DSP可以使用波束成形算法来更改来自麦克风的数字信号以形成空间滤波器使得来自选定方向的声音被放大，同时来自其它方向的声音被衰减。通常类型的波束成形算法包括延迟和加和波束成形算法、巴特利特波束成形算法、超方向性波束成形算法、最小平方波束成形算法和最小方差无畸变响应(MVDR)波束成形算法。可以使用能够使得能够检测到并放大来自选定方向的声音同时最小化来自其它不想要的方向的声音的任何类型的波束成形算法。 0037 如之前所讨论的，使用会议扬声器电话的挑战之一在于在使得多方能够讲话的同时最小化背景噪声。例如，如果一个人正在演示，并且，会议电话被定向为检测来自该演示的音频，则坐在会议。

22、电话周围的另一位置处的发表评论或提问题的另一个人可能不会被会议电话检测到。更具体而言，会议电话可能最小化由第二扬声器输出的音频，假定其是背景噪声。因此，电话呼叫另一侧的(一个或多个)人可能无法听到讲话的第二个人。这在第二个人是电话会议主席或另一高级人员的情况中特别具有挑战性。 0038 为了克服这些限制，会议呼叫主席人员相对于会议扬声器电话的位置可以被识别。会议扬声器电话随后可以被配置为检测来自会议主席方向的音频，即便另一个人正在更大声地讲话。这使得会议主席能够在会议呼叫的任何时间点添加能够被电话呼叫的另一端的(一个或多个)人听到的输入。 0039 存在识别会议呼叫主席相对于会议扬。

23、声器电话的位置的许多不同方式。在一个实施例中，会议电话可以包括可被配置为接收来自电话会议主持人的音频的选定位置。例如，说明书CN 102685339 A 5/9页 7 图1中的会议电话100中的六个区间中的一个可以被配置成被设置为接收来自电话会议主持人的音频。该选择可以称作主持人区间。电话会议主持人可以旋转电话使得主持人区间指向主持会议呼叫的人。 0040 会议电话100可以被配置为允许主持人激活或撤消“主持人模式”，在该模式中，主持人区间被配置为检测比选定阈值更大的来自主持人区间的方向的音频。该阈值可以被设置使得其大约等于来自电话会议主持人的典型语音会话幅度。该阈值可以是工厂。

24、设置的或可以是可由用户调节的。电话会议主持人可以经由会议电话上的按钮或图形用户界面或经由与会议电话通信的计算设备来激活“主持人模式”。 0041 当主持人模式被激活时，随后可以在主持人区间的方向上检测大于选定阈值的音频。该音频可以经由电话呼叫被放大和传送。在一个实施例中，当主持人模式被激活并检测到来自主持人区间的方向的具有在选定阈值电平以上的幅度的音频时，会议电话可以被配置为接收来自此方向的音频，同时最小化从任何其它方向接收的音频。到达电话呼叫的另一侧的(一个或多个)人的结果将是：每当指定的电话会议主持人讲话时，第一扬声器就被中断。 0042 可替换地，会议电话可以被配置为继续接。

25、收来自第一扬声器的音频或来自第一方向的音频，并且，当主持人模式被激活且来自主持人方向的音频幅度大于选定阈值时，加上从主持人区间的方向接收的音频。这可以导致在电话呼叫另一侧的(一个或多个)人能够同时听到第一扬声器(和/或来自第一方向的音频)和主持人扬声器(和/或来自电话会议主持人的方向的音频)二者，如同这(一个或多个)人物理地出现在会议电话的位置处那样发生。 0043 在另一实施例中，电话会议主持人的方向可以被电子地识别。不是使用被配置为提供单个方向上的主持人模式的电话会议扬声器电话，而是用户或主持人可以电子地识别主持人相对于会议电话的位置。例如，会议电话可以被配置为使得用户能够按。

26、压会议电话上的按钮来识别主持人的位置。可替换地，会议电话可以显示图形用户界面或与图形用户界面电子地连接，该图形用户界面可以被配置用于选择主持人相对于会议电话将位于的方向。当主持人模式被激活时，会议电话随后可以被配置为使从电话会议主持人的方向检测到的音频优先，如以上所讨论的。 0044 在另一实施例中，电话会议主持人相对于会议电话的位置可以被动态地确定。动态地确定电话会议主持人的位置的能力提供许多优点。可以允许电话会议主持人在电话呼叫期间到处移动。例如，电话会议主持人可以从桌边的座位发起会议呼叫。电话会议主持人随后可以移动到会议室中的白板或另一位置处。会议电话可以被配置只要电话会议。

27、主持人一讲话就识别并使得从电话会议主持人的方向检测到的音频优先，如以上所讨论的。 0045 电话会议主持人相对于会议电话的位置可以以许多不同的方式被动态地确定。例如，在一个实施例中，会议电话主持人的位置可以基于语音识别被确定。电话会议主持人可以提供语音样本给会议电话。语音样本可以被用来识别电话会议主持人讲话的时间。电话会议主持人的位置可以基于哪些麦克风最先检测到来自电话会议主持人的音频来确定。当电话会议主持人的位置改变时，会议电话可以被配置为提供对来自更新后的会议电话位置的音频的优先检测。 0046 在另一实施例中，会议电话主持人可以使用经由有线或无线连接耦合到会议电话说明书。

28、CN 102685339 A 6/9页 8 的便携式麦克风。无线连接可以经由诸如蓝、IEEE 802.11、DECT等的工业标准来实现。便携式麦克风可以用来不仅在电话会议主持人在房间内移动时接收来自电话会议主持人的音频，还可以用来确定电话会议主持人相对于会议电话的距离。如以上所讨论的，会议电话主持人的位置可以基于哪些麦克风最先检测到音频来确定。 0047 例如，电话会议主持人相对于会议电话的距离可以基于在便携式麦克风处接收的音频相对于在会议电话处的第一麦克风处接收的音频的时间差来确定。便携式麦克风处的声音被转换成电信号并且经由有线或无线信号被传送至会议电话。有线或无线信号将以接近光。

29、速传送。然而，来自电话会议主持人的音频信号将以声速传送到会议电话处的麦克风。无线信号的接收相对于较慢的音频信号的接收的定时差可以被用来确定电话会议主持人的距离。关于电话会议主持人距离会议电话的距离获得的信息可以随后被用来调节麦克风在定向地接收来自电话会议主持人的音频时的增益和/或灵敏度。这将在以下更全面地讨论。 0048 会议电话的主持人模式 0049 为了在具有多个麦克风的会议电话中实现主持人模式，这些麦克风中的一个或多个麦克风的增益可以关于电话会议主持人的方向被调节。这可以使用模拟电路或数字电路来实现。 0050 在一个示例性实施例中，会议电话可以被分割成区间，如图3所示。图3。

30、示出被分割成6个区间的会议电话。会议电话可以具有比6个区间更多或更少的区间。每个区间可以包括一个或多个麦克风。每个麦克风可以连接到DSP或等同物。还可以包括另外的电子电路，诸如用来调节每个麦克风的输出的增益的放大器。放大器的输出可以被发送给模拟转数字转换器，其随后可以被发送给DSP。每个麦克风的输出可以使用波束成形算法被调节，诸如如下等式： 0051 0052 0053 0054 0055 其中，t是时间，N是数字滤波器的系数数目，h 1i 是用于第一区间中的麦克风的时域中的数字滤波器系数，并且x 1i 是来自第一区间的麦克风的信号。如等式1中所示，可以针对会议电话的每个区间中的。

31、每个麦克风进行计算。在一个实施例中，诸如有限脉冲响应 (FIR)滤波器之类的数字滤波器可以被用来对进入信号滤波器系数加权来创建用于放大期望的音频信号并衰减不期望的音频信号的空间滤波器，如之前所讨论的。以上示例不意图是限制性的。存在可以用来对麦克风进行空间滤波以在会议电话处获得期望音频信号的许多算法和滤波手段。在期望的音频信号已经被获得时，其可以经由公共交换电话网络 (PSTN)或经由诸如因特网协议上的语音(VoIP)信号的数字化信号或其他类型的基于分组的通信而被发送给一方或多方。 0056 根据一个实施例，“主持人模式”可以通过对如图3中所示的会议电话的每个区间说明书CN 102。

32、685339 A 7/9页 9 中的麦克风的系数值进行加权来实现。例如，权重值“w”可以被用来导致对由会议电话的某一区间中的麦克风接收的音频的优先对待。因此，等式1变为如下等式1： 0057 0058 0059 0060 0061 每个区间中的权重的权重值一开始可以被设置成选定的单一值以对每个区间提供均等的加权。在一个示例中，权重值“w”可以被默认设置成一(1)。 0062 区间中的一个随后可以被识别为是最接近电话会议主持人的，从而被指定为主持人模式区间。随后，可以基于因子数相对于其它区间中的加权因子来增大主持人模式区间的权重。一个因子是音频将被检测到并经由会议呼叫被传送的预定音频阈值。

33、。增大的权重值“w”可以使得具有较低幅度的音频能够被检测到。 0063 在一个实施例中，用于主持人模式区间的加权因子可以被手动地控制。加权因子可以使用位于会议电话上的物理控件来手动控制，所述控件例如是音量加大和音量减小按钮、滑动控件、与会议电话通信的图形用户接口控件等等。如果电话会议主持人走到离会议电话更远的地方，则需要增大权重值以允许更低幅度的音频被检测到。当电话会议主持人走到离会议电话更近的地方，则需要减小权重值以使得电话会议主持人方向上的不注意的背景噪声不被检测到和发送。 0064 在另一实施例中，用于主持人模式区间的加权因子可以通过检测电话会议主持人离会议电话的距离(如以。

34、上讨论的)并基于距离调节加权因子而被自动控制。可替换地，基于电话会议主持人离会议电话的距离以及诸如背景噪声量的其它因子的自动调节的组合可以与手动调节用于主持人区间的加权因子的能力组合。 0065 另外，其它区间中的麦克风的加权因子也可以按照期望被增大或减小。例如，如果在一个方向上存在相对高的背景噪声电平，则用于该方向上的一个或多个区间的加权因子可以被减小为小于1，从而衰减从该方向接收的声音。 0066 在另一实施例中，公开了也能够与在电话会议电话上接收来自电话会议主持人的声音的系统400，如图4中提供的示例框图所示。框图不是按比例绘制的。 0067 系统400包括电话会议电话402，。

35、其具有多个麦克风404，麦克风404被配置为用于接收来自选定方向的音频信号的波束成形接收器。方向识别模块406被电子地耦合到电话会议电话以允许用户识别所要识别的电话会议主持人408相对于电话会议电话的方向。电话会议主持人可以是被选定来主持电话会议呼叫的任何人。电话会议主持人相对于电话会议电话的方向可以通过物理地移动电话会议电话、电子地选择电话会议电话上靠近电话会议主持人的位置或电子地识别电话会议主持人相对于电话会议电话上的麦克风的位置而被识别，如以上所讨论的。 0068 方向偏置模块410被配置为偏置多个麦克风404中的选定麦克风来相对于来自其它方向的音频接收来自从所识别的电话会。

36、议主持人408的方向的音频信号。在该示例中，说明书CN 102685339 A 8/9页 10 电话会议主持人408位于相对于电话会议电话402的麦克风的方向上。麦克风402可以被配置为接收来自电话会议主持人的方向的音频。选定麦克风可以通过将麦克风加权成更灵敏或不那么灵敏(如以上所讨论的)而被偏置。这使得无论何时只要电话会议主持人发言或产生其它类型的音频时来自电话会议主持人的方向的音频都能够被选择并经由会议电话被传送，从而使得电话会议主持人能够控制该会议。 0069 尽管会议电话402被配置为被偏置以接收来自电话会议主持人的方向的音频，但是其通常不被配置为在其它方向上被偏置。例。

37、如，当电话会议的参加者412想要讲话时，他或她必须等待其它每个人停止讲话以便被会议电话检测到。然而，到这发生时，参加者的评论可能不再是相关的。相应地，会议电话还可以包括评论按钮414。评论按钮可以是任何物理按钮或开关，或由与电话会议电话通信的图形用户界面提供的虚拟按钮。 0070 评论按钮414可以产生用来指示有人有评论或问题的时间的音频铃声。音频铃声可以告知讲话者和/或电话会议主持人有人有问题。扬声器和电话会议主持人随后可以允许参加者412问问题。如果没有其他人(包括主持人408)正在讲话，则会议电话被配置为接收来自另一讲话者(诸如参见者412)的音频。来自参见者412的音频随后。

38、将被传送给电话会议中所涉及的其它方，从而使得参加者能够及时评论或提问。 0071 在另一实施例中，公开了用于在电话会议电话处接收来自电话会议主持人的声音的方法，如图5的流程图中所示。该方法包括识别510充当电话会议主持人的人。可以相对于电话会议电话来确定520所识别的电话会议主持人的位置。电话会议电话上的多个麦克风被配置530成无论何时只要来自电话会议主持人的位置的音频信号具有大于预定阈值电平的幅度时就接收来自该位置的音频的波束成形接收器。多个麦克风中的选定麦克风被偏置540来相对于来自相对于电话会议电话的其它方向的声音接收来自电话会议主持人的声音。 0072 如之前所讨论的，识。

39、别电话会议主持人的位置可以包括在会议电话上的预定位置物理地移动到朝向电话会议主持人的方向。可替换地，所识别的电话会议主持人相对于会议电话的位置可以被电子地识别。例如。按钮、滑块或图形用户界面可被用来电子地识别电话会议主持人相对于电话会议电话的位置。在另一实施例中，如之前所讨论的，所识别的电话会议主持人的位置可以使用语音识别来确定。 0073 应当理解，所公开的本发明的实施例不限于在此公开的特定结构、处理步骤或材料，而是可以扩展到本领域普通技术人员将认识到的等同物。还应当理解，在此采用的术语仅用于描述具体实施例的用途并且不意图是限制性的。 0074 各种技术或其某些方面或部分可以采用。

40、有形介质中包含的程序代码(指令)的形式，有形介质诸如是软碟、CD-ROM、硬驱或任何其它机器可读的存储介质，其中当程序代码被加载到诸如计算机之类的机器中并被机器运行时，机器变成用于实行各种技术的装置。在可编程计算机上的程序代码运行的情况中，计算设备可以包括处理器、处理器可读的存储介质(包括易失性和非易失性的存储器和/或存储元件)、至少一个输入设备以及至少一个输出设备。可以实现或利用在此所述的各种技术的一个或多个程序可以使用应用编程接口(API)、可重用控件等。这样的程序可以以高级的面向程序或面向对象的编程语言来实现以与计算机系统通信。然而，(一个或多个)程序可以以汇编或机器语言实。

41、现，如果期望的话。在任何情况中，语言可以是已编译或已解释的语言，并且可以与硬件实现相结合。说明书CN 102685339 A 10 9/9页 11 0075 贯穿该说明书中对“一个实施例”或“实施例”的提及意味着结合实施例描述的特定特征、结构或特点被包括在本发明的至少一个实施例中。因此，贯穿该说明书的各个地方出现的短语“在一个实施例中”或“在实施例中”不一定都指同一实施例。 0076 为了方便，这里使用的多个项目、结构元素、组成元素和/或材料可以呈现在共同的列表中。然而，这些列表应当像列表中的每个成员被单独地识别为分离的特有的成员那样去理解。因此，在单单基于列表中的各个成员在公。

42、共群组中的表示并且没有相反的指示的情况下，这样的列表中的个别的成员不应当理解为同一列表中的任何其它成员的实际等同物。另外，在可以参考本发明的各个实施例和示例以及其各个组件的替换物。应当理解，这样的实施例、示例和替换例不应被理解成另一个的实际等同物，而是应当理解为是本发明的分离和自主的表示。 0077 此外，在一个或多个实施例中，所描述的特征、结果或特点可以以任何适当的方式被组合。在以下描述中，诸如长度、宽度、形状等的示例之类的各种具体细节被提供，以提供对本发明的实施例的透彻理解。然而，本领域技术人员将认识到本发明可以在没有这些具体细节中的一个或多个的情况下或利用其它方法、组件、材。

43、料等来实行。在其它实例中，公知的结构、材料或操作未被详细示出或描述以避免模糊本发明的方面。 0078 尽管以上示例在在一个或多个具体应用中说明本发明的原理，但是对于本领域技术人员显然的是，在不偏离本发明的原理和改变并且没有实行创造性能力的情况下可以对实现方式的形式、使用和细节做许多修改。相应地，不意图本发明被限制，除了如权利要求所述那样受限制以外。说明书CN 102685339 A 11 1/5页 12 图1 说明书附图CN 102685339 A 12 2/5页 13 图2 说明书附图CN 102685339 A 13 3/5页 14 图3 说明书附图CN 102685339 A 14 4/5页 15 图4 说明书附图CN 102685339 A 15 5/5页 16 图5 说明书附图CN 102685339 A 16 。

展开阅读全文