ImageVerifierCode 换一换
格式:PDF , 页数:17 ,大小:528.32KB ,
资源ID:1107121      下载积分:30 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zhuanlichaxun.net/d-1107121.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(声音处理设备、声音处理方法及声音处理程序.pdf)为本站会员(t****)主动上传,专利查询网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知专利查询网(发送邮件至2870692013@qq.com或直接QQ联系客服),我们立即给予删除!

声音处理设备、声音处理方法及声音处理程序.pdf

1、10申请公布号CN102045621A43申请公布日20110504CN102045621ACN102045621A21申请号201010503344622申请日20100930200923836620091015JPH04R3/0220060171申请人索尼公司地址日本东京都72发明人花井早纪铃木三博74专利代理机构北京集佳知识产权代理有限公司11227代理人杜诚李春晖54发明名称声音处理设备、声音处理方法及声音处理程序57摘要本发明涉及声音处理设备、声音处理方法及声音处理程序。所述声音处理设备包括功率谱运算单元,获得音频信号的功率谱;包络分量去除单元,去除所述功率谱的包络分量并生成表示所述

2、功率谱的峰的信号特征;滤波器特征计算单元,通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书7页附图8页CN102045625A1/1页21一种声音处理设备,包括功率谱运算装置,用于获得音频信号的功率谱;包络分量去除装置,用于去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算装置,用于通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。2根据权

3、利要求1所述的声音处理设备,其中所述包络分量去除装置将所述功率谱转换成倒频谱,在所述倒频谱的低阶分量被设定成0的情况下进行逆转换,并且去除所述功率谱的所述包络分量。3根据权利要求1所述的声音处理设备,还包括时间平均化装置,用于对所述信号特征进行时间平均化,其中所述滤波器特征计算装置通过使用经所述时间平均化装置时间平均化的信号特征来计算所述滤波器特征。4根据权利要求1所述的声音处理设备,还包括音调检测装置,用于通过使用所述功率谱来检测所述音频信号的音调;以及谐波结构去除装置,用于在所述信号特征具有谐波结构时将所述信号特征的等于或接近于所述音调的正整数倍的频率分量设定成0,其中所述滤波器特征计算装

4、置通过使用由所述谐波结构去除装置获得的所述信号特征来计算所述滤波器特征。5一种包含在声音处理单元中的声音处理方法,所述方法包括步骤获得音频信号的功率谱;去除所述功率谱的包络分量,并生成表示所述功率谱的峰的信号特征;通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征;以及通过使用所述滤波器特征对所述音频信号进行滤波。6一种使计算机进行处理的程序,所述处理包括步骤获得音频信号的功率谱;去除所述功率谱的包络分量,并生成表示所述功率谱的峰的信号特征;通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征;以及通过使用所述滤波器特征对所述音频信号进行滤波。7一种声音处理设备,包括功率谱运算单

5、元,获得音频信号的功率谱;包络分量去除单元,去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算单元,通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。权利要求书CN102045621ACN102045625A1/7页3声音处理设备、声音处理方法及声音处理程序技术领域0001本发明涉及声音处理设备、声音处理方法及声音处理程序,更具体地说,涉及一种能够高准确度地抑制啸声的声音处理设备、声音处理方法及声音处理程序。背景技术0002当由麦克风收集的声音经放大器放大然后从诸如扬声器的扩音系统输出时,所输出的声音通

6、过空气传播,并被反馈给麦克风以形成闭环。取决于诸如音量或每个部件的位置的条件,音频信号的特定频率的振幅逐渐增大,导致称为啸声的振荡。0003自动抑制啸声的方法是,通过频率分析来检测发生啸声的频率以下称为啸声频率,并通过建立多个与啸声频率相对应的陷波滤波器来减小啸声频率的增益例如,参见日本未经审查的专利申请公报200949921号。发明内容0004然而,由于使用阈值来检测啸声频率,因此如果阈值低,则对啸声的响应快,但是有可能发生对啸声频率的检测错误,并且声音质量可能下降。0005如果阈值高,则啸声频率的检测错误减少并且声音质量改善,但是因为对啸声的响应慢,所以在啸声发生之后才将其抑制。0006对

7、于误检测的啸声频率或不再发生啸声的啸声频率,可以释放陷波滤波器以抑制声音质量的下降,但是为此目的的控制是困难的。0007如上所述,现有技术的方法难以高准确度地抑制啸声。0008期望高准确度地抑制啸声。0009根据本发明的实施例,提供了一种声音处理设备,包括功率谱运算装置,用于获得音频信号的功率谱;包络分量去除装置,用于去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算装置,用于通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,用于通过使用所述滤波器特征对所述音频信号进行滤波。0010根据本发明实施例的声音处理方法和声音处理程序与根据本发明实施例的声

8、音处理设备相对应。0011在本发明的实施例中,获得音频信号的功率谱,去除功率谱的包络分量,生成表示功率谱的峰的信号特征,利用信号特征来计算用于抑制该信号特征的滤波器特征,并利用滤波器特征对声音特性进行滤波。0012根据本发明的实施例,可以高准确度地抑制啸声。附图说明0013图1是示出根据本发明实施例的声音处理设备的结构示例的框图。0014图2是示出图1中的特性计算单元的详细结构示例的框图。说明书CN102045621ACN102045625A2/7页40015图3A至图3C示出了图2中的特性计算单元中的信号。0016图4A至图4C示出了图2中的特性计算单元中的信号。0017图5是示出由图2中的

9、特性计算单元进行的滤波器特征计算的流程图。0018图6是示出图1中的特性计算单元的另一个详细结构示例的框图。0019图7A至图7C示出了图6中的特性计算单元中的信号。0020图8是示出由图6中的特性计算单元进行的滤波器特征计算的流程图。0021图9是示出计算机的实施例的结构示例的框图。具体实施方式00220023声音处理设备的实施例的结构示例0024图1是示出根据本发明实施例的声音处理设备的结构示例的框图。0025图1中的声音处理设备10包括麦克风11、信号处理单元12、放大器13和扬声器14;输入到麦克风11的声音通过抑制啸声而被放大,然后从扬声器14输出。0026具体来说,声音处理设备10

10、的麦克风11收集环境声音,并将该声音的音频信号提供给信号处理单元12。0027信号处理单元12包括抑制滤波器21和特性计算单元22。抑制滤波器21使用从特性计算单元22提供的滤波器特征对从麦克风11提供的音频信号进行滤波,并将该音频信号提供给放大器13。0028特性计算单元22使用从麦克风11提供的音频信号来计算抑制滤波器21的滤波器特征,并将该滤波器特征提供给抑制滤波器21。这更新抑制滤波器21。将参照后面示出的图2对特性计算单元22的细节进行描述。0029放大器13对从抑制滤波器21提供的音频信号进行放大,并将该音频信号提供给扬声器14。扬声器14输出与从放大器13提供的音频信号相对应的声

11、音。0030特性计算单元的详细结构示例0031图2是示出图1中的特性计算单元22的详细结构示例的框图。0032图2中的特性计算单元22包括FFT快速傅里叶变换运算单元31、功率谱运算单元32、包络分量去除单元33以及滤波器特征计算单元34。特性计算单元22逐帧地处理从麦克风11提供的音频信号。0033FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进行FFT运算将该音频信号转换为频域信号。FFT运算单元31将该频域信号提供给功率谱运算单元32。0034功率谱运算单元32计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除

12、单元33。0035包络分量去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量以生成表示该功率谱的峰的信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0036滤波器特征计算单元34通过使用从包络分量去除单元33提供的信号特征来计算用于抑制该信号特征的滤波器特征。具体来说,滤波器特征计算单元34使用以下公式1说明书CN102045621ACN102045625A3/7页5至3中的任一个来计算滤波器特征。0037IFPF1003800390040在公式1至3中,PF表示信号特征,IF表示滤波器特征,是确定抑制滤波器21的增益的系数。0041对特性计算单元中的信号的说

13、明0042图3A至图4C示出了图2中的特性计算单元22中的信号。0043在图3A至图4C中,横轴表示频率F,纵轴表示音频信号的电平DB。0044在图2中的特性计算单元22的包络分量去除单元33中,从在图3A中用实线指示的功率谱中去除在图3A中用虚线指示的包络分量以生成图3B中的信号特征。0045然后,滤波器特征计算单元34例如使用图3B中的信号特征来进行公式1的运算1,以计算图3C中的滤波器特征。0046去除包络分量的方法例如使用倒频谱。0047在该方法中,首先对在图4A中用实线指示的功率谱SF的对数LOGSF进行IFFT快速傅里叶逆变换,并将该功率谱转换成图4B中的倒频谱。0048接下来,在

14、图4B中的倒频谱中,虚线框内的低阶分量包络分量被设定为0DB,而实线框内的高阶分量不变。然后,对所得到的倒频谱进行FFT运算。这生成作为信号特征的功率谱,从该功率谱中去除了图4C中的包络分量。0049对由特性计算单元进行的处理的说明0050图5是示出由图2中的特性计算单元22进行的滤波器特征计算的流程图。对例如从麦克风11提供的音频信号逐帧地进行滤波器特征计算。0051在图5中的步骤S11中,FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进行FFT运算将该音频信号转换成频域信号。FFT运算单元31将该频域信号提供给功率谱运算单元32。0052在步骤S12中,功率谱运算单元32

15、计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除单元33。0053在步骤S13中,包络分量去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量以生成信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0054在步骤S14中,滤波器特征计算单元34通过利用从包络分量去除单元33提供的信号特征进行公式1至3中的任一个来计算滤波器特征。然后,处理结束。0055如上所述,声音处理单元10获得音频信号的功率谱,通过去除功率谱的包络分量来生成信号特征,通过使用信号特征来计算用于抑制和平坦化信号特征的滤波器特征,并使用

16、滤波器特征对音频信号进行滤波。说明书CN102045621ACN102045625A4/7页60056因此,可以在发生啸声之前响应于发生的征兆逐渐地防止啸声发生。另外,利用音频信号的信号特征自适应地更新抑制滤波器21,因此可以抑制必须抑制的频率的音频信号的增益。如上所述,可以高准确度地抑制啸声。0057特性计算单元的另一个详细结构示例0058图6是示出图1中的特性计算单元22的另一个详细结构示例的框图。0059在图6中的结构中,与图2中相同的部件具有相同的附图标记。适当省略对其的赘述。0060与图2中的结构不同的是,图6中的特性计算单元22具有音调检测单元51、谐波结构去除单元52和时间平均化

17、单元53。图6中的特性计算单元22计算滤波器特征,用于对从中去除了频率是声音音调的正整数倍的分量的信号特征进行时间平均化,并用于抑制所得到的信号特征。0061音调检测单元51对从功率谱运算单元32输出的功率谱的对数进行IFFT运算,以将该功率谱转换成倒频谱。音调检测单元51在与倒频谱的声音音调可以存在的频率相对应的范围例如,33MS至15MS中检测最高峰,并采用该峰的频率作为声音音调的候选。音调检测单元51获得音调的候选与处理对象帧的零阶倒频谱之间的比率,并且如果该比率等于或大于阈值,则采用音调的候选作为音调。音调检测单元51将该音调提供给谐波结构去除单元52。0062谐波结构去除单元52确定

18、由包络分量去除单元33输出的信号特征是否具有这样的谐波结构,其中在是从音调检测单元51提供的音调的正整数倍的频率处存在峰。0063如果谐波结构去除单元52检测到信号特征具有该谐波结构,则谐波结构去除单元52将频率是信号特征音调的正整数倍的信号特征的分量确定为声音分量,并将该分量设定为0DB。即,信号特征的音调的分量和该音调的更高的谐波分量被设定为0DB。然后,谐波结构去除单元52将所得到的信号特征提供给时间平均化单元53。要被谐波结构去除单元52设定为0DB的分量除了音调的更高的谐波分量之外还可以包括边带频率的分量。0064时间平均化单元53保持从谐波结构去除单元52提供的信号特征。时间平均化

19、单元53使用从谐波结构去除单元52提供的处理对象帧的信号特征以及先前帧的信号特征对信号特征进行时间平均化。0065例如,时间平均化单元53使用以下公式4连同处理对象帧的信号特征INF和处理对象帧的前一帧的信号特征IN1F一起对信号特征INF进行时间平均化。在公式4中,表示系数。0066INFIN1FINF140067010068根据公式4,时间平均化之后的处理对象帧的信号特征INF由处理对象帧的信号特征INF与处理对象帧的前一帧的信号特征IN1F的加权和来表示。0069公式4用于低阶IIR型时间平均化,但是时间平均化单元53除了低阶IIR型时间平均化之外还可以进行高阶IIR或FIR型时间平均化

20、或非线性时间平均化。0070时间平均化单元53将经时间平均化的信号特征提供给滤波器特征计算单元34。其计算滤波器特征,用于抑制经时间平均化的信号特征。0071对特性计算单元中的信号的说明说明书CN102045621ACN102045625A5/7页70072图7A至图7C示出了图6中的特性计算单元22中的信号。0073在图6中的特性计算单元22的音调检测单元51中,对功率谱的对数进行IFFT运算,以将该功率谱转换成图7A中的倒频谱。在倒频谱的声音音调可以存在的频率范围中检测最高峰P,在图7A中该范围由实线框指示,峰P的频率FP被用作声音音调的候选。然后,获得声音音调的候选与零阶倒频谱之间的比率

21、。在图7A至图7C的示例中,该比率等于或大于阈值,从而作为音调的候选的频率FP被用作声音音调。0074谐波结构去除单元52检测图7B中的信号特征中频率是声音音调的正整数倍的分量FP、2FP、3FP、4FP。当分量具有如图7B中所示的峰时,检测到信号特征具有音调谐波结构,并且所述分量被设定为0DB。结果,获得图7C中所示的信号特征。0075对特性计算单元中的处理的说明0076图8是示出由图6中的特性计算单元22进行的滤波器特征计算的流程图。对例如从麦克风11提供的音频信号逐帧地进行该滤波器特征计算。0077在图8中的步骤S31中,FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进

22、行FFT运算将该音频信号转换成频域信号。然后,FFT运算单元31将该频域信号提供给功率谱运算单元32。0078在步骤S32中,功率谱运算单元32计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除单元33和音调检测单元51。0079在步骤S33中,音调检测单元51使用从功率谱运算单元32提供的功率谱来检测音调的候选。具体来说,音调检测单元51对功率谱的对数进行IFFT运算以将该功率谱转换成倒频谱。音调检测单元51在与倒频谱的声音音调可以存在的频率相对应的范围中检测最高峰,并采用峰的频率作为声音音调的候选。0080在步骤S34中,包络分量

23、去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量,以生成信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0081在步骤S35中,音调检测单元51确定音调的候选与处理对象帧的零阶倒频谱之间的比率是否等于或大于阈值。在步骤S35中如果该比率等于或大于阈值,则音调检测单元51采用该候选作为音调并将其提供给谐波结构去除单元52。0082在步骤S36中,谐波结构去除单元52确定由包络分量去除单元33提供的信号特征是否具有这样的谐波结构,其中在是从音调检测单元51提供的音调的正整数倍的频率处存在峰。0083在步骤S36中如果确定信号特征具有音调的谐波结构,则在步骤S37

24、中谐波结构去除单元52将信号特征中频率是音调的正整数倍的分量设定为0DB。然后,谐波结构去除单元52将所得到的信号特征提供给时间平均化单元53,并且处理进行到步骤S38。0084如果在步骤S35中确定音调的候选与处理对象帧的零阶倒频谱之间的比率小于阈值,或者如果在步骤S36中信号特征不具有音调的谐波结构,则谐波结构去除单元52将由包络分量去除单元33生成的信号特征照原样提供给时间平均化单元53。处理进行到步骤S38。0085在步骤S38中,时间平均化单元53使用以上公式4连同处理对象帧的信号特征说明书CN102045621ACN102045625A6/7页8和处理对象帧的前一帧的信号特征一起对

25、从谐波结构去除单元52提供的处理对象帧的信号特征进行时间平均化。0086在步骤S39中,滤波器特征计算单元34使用从时间平均化单元53提供的经时间平均化的特性信号来计算滤波器特征,并将结果提供给抑制滤波器21图1。然后,处理结束。0087如上所述,在具有图6中的特性计算单元22的声音处理单元10中,抑制滤波器21使用与经时间平均化的信号特征相对应的滤波器特征来进行滤波,因此急剧地改变的其它信号及音频信号未被抑制,并且改善了从扬声器14输出的声音的质量。0088另外,具有图6中的特性计算单元22的声音处理单元10检测声音音调并通过使用其中频率是音调的正整数倍的分量被设定为0DB的信号特征来计算滤

26、波器特征,因此在抑制滤波器21中,声音音调的谐波结构未丢失。结果,改善了从扬声器14输出的声音的质量。0089对根据本发明实施例的计算机的说明0090可以通过硬件或软件来实现上述一系列处理。当通过软件来实现这一系列处理时,构成软件的程序安装在通用计算机等中。0091图9示出了其中安装有用于进行这一系列处理的程序的计算机的实施例的结构示例。0092程序可以预先存储在作为计算机中的内置存储介质的存储单元208或ROM只读存储器202中。0093程序还可以存储记录在可移动介质211上。这种类型的可移动介质211可以被提供为所谓的套装软件。可移动介质211的示例是软盘、CDROM只读光盘存储器、MO磁

27、光盘、DVD数字多用途盘、磁盘和半导体存储器。0094可以通过驱动器210从可移动介质211将程序安装在计算机中,或者可以通过通信网或广播网将程序下载到计算机来将程序安装在存储单元208中。即,可以将程序通过用于数字卫星广播的人造卫星从下载站点以无线方式传送到计算机,或者通过诸如LAN局域网或因特网的网络传送到计算机。0095计算机包括CPU中央处理单元201,输入/输出接口205通过总线204连接到CPU201。0096当用户通过操作输入单元206经由输入/输出接口205输入指令时,CPU201根据该指令执行存储在ROM202中的程序。可替选的是,CPU201通过将程序加载到RAM随机存取存

28、储器203来执行存储在存储单元208中的程序。0097这使得CPU201执行根据以上流程图的处理或者由以上框图中的结构进行的处理。然后,如果需要的话,CPU201通过输入/输出接口205将处理结果输出到输出单元207,从通信单元209发送处理结果,或者将处理结果存储在存储单元208中。0098输入单元206包括键盘、鼠标和麦克风。输出单元207包括LCD液晶显示器和扬声器。0099在本说明书中,计算机在根据程序的处理过程中不必在时间顺序上遵循流程图的顺序。即,计算机根据程序进行的处理包括并行地或单独地进行的处理例如,并行处理或目标处理。说明书CN102045621ACN102045625A7/

29、7页90100程序可以通过一个计算机处理器来处理,或者通过多个计算机分布式地处理。程序可以被传送到远程计算机来执行。0101本申请包含与2009年10月15日提交日本专利局的日本优先权专利申请JP2009238366中所公开的主题相关的主题,通过引用将其全部内容合并于此。0102本领域技术人员应当理解,根据设计要求及其它因素可以想到各种修改、组合、子组合和变更,只要它们在所附权利要求书或其等同物的范围内即可。说明书CN102045621ACN102045625A1/8页10图1说明书附图CN102045621ACN102045625A2/8页11图2图3A说明书附图CN102045621ACN102045625A3/8页12图3B图3C图4A图4B图4C说明书附图CN102045621ACN102045625A4/8页13图5说明书附图CN102045621ACN102045625A5/8页14图6图7A说明书附图CN102045621ACN102045625A6/8页15图7B图7C说明书附图CN102045621ACN102045625A7/8页16图8说明书附图CN102045621ACN102045625A8/8页17图9说明书附图CN102045621A

copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1