一种机器人定位声源的方法.pdf

上传人:000****221 文档编号:6018807 上传时间:2019-04-03 格式:PDF 页数:18 大小:1,007.57KB
返回 下载 相关 举报
摘要
申请专利号:

CN201610810766.5

申请日:

2016.09.08

公开号:

CN106405499A

公开日:

2017.02.15

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G01S 5/20申请日:20160908|||公开

IPC分类号:

G01S5/20

主分类号:

G01S5/20

申请人:

南京阿凡达机器人科技有限公司

发明人:

李庭亮; 李震

地址:

211316 江苏省南京市高淳经济开发区古檀大道3号

优先权:

专利代理机构:

江苏圣典律师事务所 32237

代理人:

贺翔;刘辉

PDF下载: PDF下载
内容摘要

本发明公开的一种机器人定位声源的方法,利用时延估计和功率谱强度比较相结合的方法,通过各个声源采集装置接收到声音的功率谱强度和各个声源采集装置的空间方位估算出声源的大致方位,基本可以准确额估算声源的大致方位。功率谱强度比较是指计算出各个声源采集装置在特定频率区间平均功率谱强度,而平均功率谱强度与声源到各个声源采集装置距离成一定反比关系,即平均功率谱强度大的点离声源采集装置距离较近,平均功率谱强度小的点离声源采集装置距离较远。本发明的机器人定位声源的方法能够较为准确的对机器人周围的声源进行定位,为机器人的进一步行动提供方位依据,提高了机器人人机交互的智能性。

权利要求书

1.一种机器人定位声源的方法,其特征在于,包括以下步骤:
1)在机器人上设置若干面向不同方位的声源采集装置,设定声强阈值;
2)声强达到设定的声强阈值,声源采集装置输出若干路模拟信号,并将所述模拟信号
转换为待处理数字信号;
3)对待处理数字信号进行傅立叶变换;
4)计算待处理数字信号的平均功率谱强度;
5)对各路声源信号功率谱强度平均值进行排序;
6)根据各路信号功率谱强弱顺序估算出声源位置。
2.根据权利要求1所述的机器人定位声源的方法,其特征在于,在所述步骤3)之后,进
行如下步骤:
41)对快速傅立叶变换后的声源信号进行互功率谱计算;
51)对各路声源信号互功率谱进行频域加权运算;对加权运算后的信号进行反快速傅
立叶变换,获得本帧互相关函数;
61)峰值检测,获得声源信号延迟;
71)根据声源信号的时延,和常温下声音在空气中的传播速度,计算出声源到两个声源
采集装置之间的距离差;各声源采集装置空间坐标已知为(Xi,Yi,Zi),其中(i=1,
2,···N),N为总的阵元个数,声源的空间坐标为(X,Y,Z),由空间解析几何可列出以下方
程组:

其中C为声速,ti为声波到达各声源采集装置的时间,通过时延估计计算可以确定:

求解以上方程组,得出声源的空间坐标(X,Y,Z),即求出了声源的空间位置。
3.根据权利要求1或2所述的机器人定位声源的方法,对声源信号分别进行快速傅立叶
变换(FFT)的过程为:数据加窗得到有限长序列XN(n)直接求傅里叶变换,得频谱XN(eiω):

取频谱幅度的平方,并除以N,以此作为对x(n)真实功率谱SX(eiω)的估计:

4.根据权利要求2所述的机器人定位声源的方法,其特征在于,所述对快速傅立叶变换
后的信号进行互功率谱计算的过程为:
假设Xi(n)和Xj(n)为2个传声器接收的信号,对信号Xi(n)和Xj(n)进行前置滤波并求傅
里叶变换,得到它们之间的互功率谱Gij(ω),其中a,b分别为声音从声源传播到两个麦克风
的衰减常系数:

5.根据权利要求2所述的机器人定位声源的方法,其特征在于,所述步骤51)的过程为:

式中φ(ω)为加权函数,Gij(ω)为两个信号的互功率谱,ejωτ为复指数,dω为频域的 微
分,为了使互相关函数有尖锐的峰值,需对输入信号进行归一化,选择加权函数
φ(w)=1/|Gij(w)|
故在理想模型下互相关函数可以表示为:

取得峰值的时刻τ=τj-τi,即为两信号的时延;声源与两传感器之间存在距离差
ΔL=C*τ,因此声源发出的声波到达两传感器的信号在时间上存在τ=ΔL/C;信号Si相对
于Sj落后时间τ,即在忽略噪声的理想情况下i,j传感器所接收的信号满足Si=Sj(t-τ),也
就是信号之间存在时间延迟。
6.根据权利要求1或2所述的机器人定位声源的方法,其特征在于,所述声源采集装置
数量为4个。

说明书

一种机器人定位声源的方法

技术领域

本发明涉及机器人听觉技术领域,具体是一种机器人定位声源的方法。

背景技术

高方向性的单麦克风通常只能拾取一路信号,而麦克风阵列系统可以采集多路信
号。虽然麦克风阵列是对单个目标的数据采集,但由于各麦克风位置的不同,它采集的数据
在时域和频域上必然存在某些差异。采用多个麦克风构成一个麦克风阵列,然后进行数字
信号处理,通过多路信号的数据融合技术,就可以提取出所需要的信息,估算出声源的位
置。目前常用的声源定位方法是时延估计:首先传感器接收信号,经过计算机数字化;然后
利用数学方法对这些数据进行处理,也就是估计出信号到达各个传感器的相对时延;最后
利用这个时延估计值,通过数学计算确定出声源的位置。时延估计的算法有很多,在实际中
用的较为广泛且相对简单的一种算法是广义互相关函数法。广义互相关函数的基本原理
是:求得两组信号间的互功率谱,然后在频域内给予不同的加权运算,最后再反变换到时
域,得到两组信号之间的互相关函数,互相关函数的极值所对应的时间就是两组信号间的
时延。一般只需要两个独立的时延估计值,三维的情况需要三个独立的时延估计值。每个时
延估计值对应一个二次、三次方程,求解这些方程组就可以就出声源的坐标,但这个坐标实
际上也是估计值,存在一定的误差,许多的仿真研究也证明,该算法适合于单个声源的定
位,在复杂的噪声环境里,需要结合其他声源定位方法,综合判断,才能具备一定的准确性。

基于传声器阵列的声源定位技术得到广泛的应用,随着机器人技术的发展,人们
希望智能化机器人可以服务于人们的日常生活。之前人们对智能机器人技术的发展主要集
中在移动系统和视觉系统上,缺少人机之间的交流和沟通,因此在人类与机器人之间建立
一个有效的沟通方式是非常必要的。如机器人的听觉注意机制可以对外界的声音首先发起
响应,进而引导机器人对声音目标进行观察。听觉系统还可以引起机器人的其他感官的注
意,这种多信息融合技术已经成为一个重要的研究方向。用于人机交互的机器人听觉系统
的核心构成之一便是声源定位技术。当一个机器人的使用者和智能机器人进行语言的交流
时,机器人能很快发现这个使用者或是找到这个声源的位置。除此之外,它还能在黑暗的环
境中通过声音信号寻找声源,或是在复杂的环境中寻找危险的声源。在人机交互设备中,听
觉系统水平的高低已经成为智能化水平的重要标志之一。对声源定位的准确程度是影响听
觉系统水平的重要因素。

发明内容

本发明要解决的问题是提供一种机器人定位声源的方法,该方法能够实现机器人
对声源较为准确的定位。

本发明的机器人定位声源的方法,包括以下步骤:

1)在机器人上设置若干面向不同方位的声源采集装置,设定声强阈值;

2)声强达到设定的声强阈值,声源采集装置输出若干路模拟信号,并将所述模拟
信号转换为待处理数字信号;

3)对待处理数字信号进行傅立叶变换;

4)计算待处理数字信号的平均功率谱强度;

5)对各路声源信号功率谱强度平均值进行排序;

6)根据各路信号功率谱强弱顺序估算出声源位置。

为了更加准确计算生源位置,所述步骤3)之后的步骤可替换为如下过程:

41)对快速傅立叶变换后的声源信号进行互功率谱计算;

51)对各路声源信号互功率谱进行频域加权运算;对加权运算后的信号进行反快
速傅立叶变换,获得本帧互相关函数;

61)峰值检测,获得声源信号延迟;

71)根据声源信号的时延,和常温下声音在空气中的传播速度,计算出声源到两个
声源采集装置之间的距离差;各声源采集装置空间坐标已知为(Xi,Yi,Zi),其中(i=1,
2,···N),N为总的阵元个数,声源的空间坐标为(X,Y,Z),由空间解析几何可列出以下方
程组:


其中C为声速,ti为声波到达各声源采集装置的时间,通过时延估计计算可以确
定:


求解以上方程组,得出声源的空间坐标(X,Y,Z),即求出了声源的空间位置。

进一步的,对四路数字信号分别进行快速傅立叶变换(FFT)的过程为:数据加窗得
到有限长序列xN(n)直接求傅里叶变换,得频谱XN(eiω):


取频谱幅度的平方,并除以N,以此作为对x(n)真实功率谱Sx(eiω)的估计:


进一步的,上述技术方案中,所述对快速傅立叶变换后的信号进行互功率谱计算
的过程为:

假设Xi(n)和Xj(n)为2个传声器接收的信号,对信号Xi(n)和Xj(n)进行前置滤波并
求傅里叶变换,得到它们之间的互功率谱Gij(ω):


进一步的,所述步骤51)的过程为:


式中φ(ω)为加权函数,Gij(ω)为两个信号的互功率谱,ejωτ为复指数,dω为频域

微分,为了使互相关函数有尖锐的峰值,需对输入信号进行归一化,选择加权函数

φ(w)=1/|Gij(w)|

故在理想模型下互相关函数可以表示为:


取得峰值的时刻τ=τj-τi,即为两信号的时延;声源与两传感器之间存在距离差Δ
L=C*τ,因此声源发出的声波到达两传感器的信号在时间上存在τ=ΔL/C;信号Si相对于Sj
落后时间τ,即在忽略噪声的理想情况下i,j传感器所接收的信号满足Si=Sj(t-τ),也就是
信号之间存在时间延迟。

所述声源采集装置数量为4个,也可以选择8个等等。

以上技术方案可以看出,结合声源信号的空间方位和声源信号的平均功率谱强度
估算出声源的大致方位。因麦克风阵列时一般位于机器人的头部的,因此声源定位的运算
结果会通过串口发送给机器人的头部表情控制板,表情控制板再将声源定位的结果发送给
机器人机交互装置,比如PAD板,以供机器人决策并做出相应的动作。

本发明的机器人定位声源的方法,利用时延估计和功率谱强度比较相结合的方
法,通过各个声源采集装置接收到声音的功率谱强度和各个声源采集装置的空间方位估算
出声源的大致方位,基本可以准确额估算声源的大致方位。功率谱强度比较是指计算出各
个声源采集装置在特定频率区间平均功率谱强度,而平均功率谱强度与声源到各个声源采
集装置距离成一定反比关系,即平均功率谱强度大的点离声源采集装置距离较近,平均功
率谱强度小的点离声源采集装置距离较远。

本发明的机器人定位声源的方法能够较为准确的对机器人周围的声源进行定位,
为机器人的进一步行动提供方位依据,提高了机器人人机交互的智能性。

附图说明

图1是本发明广义时延估计算法流程图;

图2是时延信号产生的原理图;

图3是由时延信号确定空间方位的原理图;

图4是互功率谱信号波形图;

图5是声源采集装置采样电路原理图;

图6是声源定位运算单元电路原理图;

图7是机器人声源定位系统模块图;

图8是本发明机器人定位声源的方法流程图;

图9是本发明实施例中四个麦克风方位示意图;

图10是本发明实施例中声源定位板在机器人上的位置示意图;

图11是本发明实施例中声源定位模块在机器人头盖骨内的位置示意图;

图12是本发明实施例中声源定位模块在机器人上的位置示意图。

具体实施方式

下面结合附图,对本发明提出的一种机器人定位声源的方法进行详细说明。如图
7、10、11和12所示,本发明的定位声源的方法,一般可用于具有声源定位模块的机器人,也
可用于其它机器人。声源定位模块可为于机器人的头部,也可以位于其他部位,特别是对于
非类人机器人。声源定位模块内有声源定位控制板,可以控制声源采集装置,声源采集装置
一般采用麦克风。声源定位控制板与表情控制系统板和人机交互系统板连接。声源采集装
置采样电路原理如图5所示,声源定位运算单元电路原理如图6所示。

如图1、2、3、8和9所示,本发明的机器人定位声源的方法,包括以下步骤:

1)在机器人上设置若干面向不同方位的声源采集装置,设定声强阈值;声源采集
装置数量不限制,本实施例中选择4个麦克风为例,4个麦克风与声源距离各不相同;

2)声强达到设定的声强阈值,声源采集装置输出若干路模拟信号,并将所述模拟
信号转换为待处理数字信号;

3)对待处理数字信号进行傅立叶变换:

数据加窗得到有限长序列xN(n)直接求傅里叶变换,得频谱XN(eiω):


取频谱幅度的平方,并除以N,以此作为对x(n)真实功率谱Sx(eiω)的估计:


4)计算待处理数字信号的平均功率谱强度;

5)对各路声源信号功率谱强度平均值进行排序;

6)根据各路信号功率谱强弱顺序估算出声源位置。

因麦克风阵列时位于机器人的头部的,因此声源定位的运算结果会通过串口发送
给机器人的头部表情控制板,表情控制板再将声源定位的结果发送给机器人机交互PAD板,
以供机器人决策并作出相应的动作,其信号流如图7示意,声源定位系统软件运算流程如图
8示意;如图10,11,12所示声,源定位模块位于机器人的头部,四个麦克风成矩形四角紧贴
于头盖骨下。

为了更加准确计算生源位置,所述步骤3)之后的步骤可替换为如下过程:

41)对快速傅立叶变换后的声源信号进行互功率谱计算,假设Xi(n)和Xj(n)为2个
传声器接收的信号,对信号Xi(n)和Xj(n)进行前置滤波并求傅里叶变换,得到它们之间的互
功率谱Gij(ω):


计算结果如图4所示。

如图4所示,51)对各路声源信号互功率谱进行频域加权运算;对加权运算后的信
号进行反快速傅立叶变换,获得本帧互相关函数:


式中φ(ω)为加权函数,为了使互相关函数有尖锐的峰值,需对输入信号进行归
一化,选择加权函数

φ(w)=1/|Gij(w)|

故在理想模型下互相关函数可以表示为:


取得峰值的时刻τ=τj-τi,即为两信号的时延;声源与两传感器之间存在距离差Δ
L=C*τ,因此声源发出的声波到达两传感器的信号在时间上存在τ=ΔL/C;信号Si相对于Sj
落后时间τ,即在忽略噪声的理想情况下i,j传感器所接收的信号满足Si=Sj(t-τ),也就是
信号之间存在时间延迟。

61)峰值检测,获得声源信号延迟;

71)根据声源信号的时延,和常温下声音在空气中的传播速度,计算出声源到两个
声源采集装置之间的距离差;各声源采集装置空间坐标已知为(Xi,Yi,Zi),其中(i=1,
2,···N),N为总的阵元个数,声源的空间坐标为(X,Y,Z),由空间解析几何可列出以下方
程组:


其中C为声速,ti为声波到达各声源采集装置的时间,通过时延估计计算可以确
定:


求解以上方程组,得出声源的空间坐标(X,Y,Z),即求出了声源的空间位置。

以上实施例仅用以说明本发明的技术方案,并非用于限定本发明的保护范围。凡
在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,其均应涵盖在本发明的
权利要求范围当中。

一种机器人定位声源的方法.pdf_第1页
第1页 / 共18页
一种机器人定位声源的方法.pdf_第2页
第2页 / 共18页
一种机器人定位声源的方法.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《一种机器人定位声源的方法.pdf》由会员分享,可在线阅读,更多相关《一种机器人定位声源的方法.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明公开的一种机器人定位声源的方法,利用时延估计和功率谱强度比较相结合的方法,通过各个声源采集装置接收到声音的功率谱强度和各个声源采集装置的空间方位估算出声源的大致方位,基本可以准确额估算声源的大致方位。功率谱强度比较是指计算出各个声源采集装置在特定频率区间平均功率谱强度,而平均功率谱强度与声源到各个声源采集装置距离成一定反比关系,即平均功率谱强度大的点离声源采集装置距离较近,平均功率谱强度小的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 测量;测试


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1