声音处理设备、声音处理方法及声音处理程序.pdf

上传人:t**** 文档编号:1107121 上传时间:2018-03-31 格式:PDF 页数:17 大小:528.32KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010503344.6

申请日:

2010.09.30

公开号:

CN102045621A

公开日:

2011.05.04

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04R 3/02申请日:20100930|||公开

IPC分类号:

H04R3/02

主分类号:

H04R3/02

申请人:

索尼公司

发明人:

花井早纪; 铃木三博

地址:

日本东京都

优先权:

2009.10.15 JP 2009-238366

专利代理机构:

北京集佳知识产权代理有限公司 11227

代理人:

杜诚;李春晖

PDF下载: PDF下载
内容摘要

本发明涉及声音处理设备、声音处理方法及声音处理程序。所述声音处理设备包括:功率谱运算单元,获得音频信号的功率谱;包络分量去除单元,去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算单元,通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。

权利要求书

1: 一种声音处理设备, 包括 : 功率谱运算装置, 用于获得音频信号的功率谱 ; 包络分量去除装置, 用于去除所述功率谱的包络分量并生成表示所述功率谱的峰的信 号特征 ; 滤波器特征计算装置, 用于通过使用所述信号特征来计算抑制所述信号特征的滤波器 特征 ; 以及 抑制滤波器, 通过使用所述滤波器特征对所述音频信号进行滤波。
2: 根据权利要求 1 所述的声音处理设备, 其中所述包络分量去除装置将所述功率谱转 换成倒频谱, 在所述倒频谱的低阶分量被设定成 0 的情况下进行逆转换, 并且去除所述功 率谱的所述包络分量。
3: 根据权利要求 1 所述的声音处理设备, 还包括 : 时间平均化装置, 用于对所述信号特 征进行时间平均化, 其中所述滤波器特征计算装置通过使用经所述时间平均化装置时间平 均化的信号特征来计算所述滤波器特征。
4: 根据权利要求 1 所述的声音处理设备, 还包括 : 音调检测装置, 用于通过使用所述功率谱来检测所述音频信号的音调 ; 以及 谐波结构去除装置, 用于在所述信号特征具有谐波结构时将所述信号特征的等于或接 近于所述音调的正整数倍的频率分量设定成 0, 其中所述滤波器特征计算装置通过使用由所述谐波结构去除装置获得的所述信号特 征来计算所述滤波器特征。
5: 一种包含在声音处理单元中的声音处理方法, 所述方法包括步骤 : 获得音频信号的功率谱 ; 去除所述功率谱的包络分量, 并生成表示所述功率谱的峰的信号特征 ; 通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征 ; 以及 通过使用所述滤波器特征对所述音频信号进行滤波。
6: 一种使计算机进行处理的程序, 所述处理包括步骤 : 获得音频信号的功率谱 ; 去除所述功率谱的包络分量, 并生成表示所述功率谱的峰的信号特征 ; 通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征 ; 以及 通过使用所述滤波器特征对所述音频信号进行滤波。
7: 一种声音处理设备, 包括 : 功率谱运算单元, 获得音频信号的功率谱 ; 包络分量去除单元, 去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特 征; 滤波器特征计算单元, 通过使用所述信号特征来计算抑制所述信号特征的滤波器特 征; 以及 抑制滤波器, 通过使用所述滤波器特征对所述音频信号进行滤波。

说明书


声音处理设备、 声音处理方法及声音处理程序

    【技术领域】
     本发明涉及声音处理设备、 声音处理方法及声音处理程序, 更具体地说, 涉及一种 能够高准确度地抑制啸声的声音处理设备、 声音处理方法及声音处理程序。背景技术
     当由麦克风收集的声音经放大器放大然后从诸如扬声器的扩音系统输出时, 所输 出的声音通过空气传播, 并被反馈给麦克风以形成闭环。取决于诸如音量或每个部件的位 置的条件, 音频信号的特定频率的振幅逐渐增大, 导致称为啸声的振荡。
     自动抑制啸声的方法是, 通过频率分析来检测发生啸声的频率 ( 以下称为啸声频 率 ), 并通过建立多个与啸声频率相对应的陷波滤波器来减小啸声频率的增益 ( 例如, 参见 日本未经审查的专利申请公报 2009-49921 号 )。 发明内容
     然而, 由于使用阈值来检测啸声频率, 因此如果阈值低, 则对啸声的响应快, 但是 有可能发生对啸声频率的检测错误, 并且声音质量可能下降。
     如果阈值高, 则啸声频率的检测错误减少并且声音质量改善, 但是因为对啸声的 响应慢, 所以在啸声发生之后才将其抑制。
     对于误检测的啸声频率或不再发生啸声的啸声频率, 可以释放陷波滤波器以抑制 声音质量的下降, 但是为此目的的控制是困难的。
     如上所述, 现有技术的方法难以高准确度地抑制啸声。
     期望高准确度地抑制啸声。
     根据本发明的实施例, 提供了一种声音处理设备, 包括 : 功率谱运算装置, 用于获 得音频信号的功率谱 ; 包络分量去除装置, 用于去除所述功率谱的包络分量并生成表示所 述功率谱的峰的信号特征 ; 滤波器特征计算装置, 用于通过使用所述信号特征来计算抑制 所述信号特征的滤波器特征 ; 以及抑制滤波器, 用于通过使用所述滤波器特征对所述音频 信号进行滤波。
     根据本发明实施例的声音处理方法和声音处理程序与根据本发明实施例的声音 处理设备相对应。
     在本发明的实施例中, 获得音频信号的功率谱, 去除功率谱的包络分量, 生成表示 功率谱的峰的信号特征, 利用信号特征来计算用于抑制该信号特征的滤波器特征, 并利用 滤波器特征对声音特性进行滤波。
     根据本发明的实施例, 可以高准确度地抑制啸声。 附图说明
     图 1 是示出根据本发明实施例的声音处理设备的结构示例的框图。 图 2 是示出图 1 中的特性计算单元的详细结构示例的框图。图 3A 至图 3C 示出了图 2 中的特性计算单元中的信号。 图 4A 至图 4C 示出了图 2 中的特性计算单元中的信号。 图 5 是示出由图 2 中的特性计算单元进行的滤波器特征计算的流程图。 图 6 是示出图 1 中的特性计算单元的另一个详细结构示例的框图。 图 7A 至图 7C 示出了图 6 中的特性计算单元中的信号。 图 8 是示出由图 6 中的特性计算单元进行的滤波器特征计算的流程图。 图 9 是示出计算机的实施例的结构示例的框图。具体实施方式
     < 实施例 >
     [ 声音处理设备的实施例的结构示例 ]
     图 1 是示出根据本发明实施例的声音处理设备的结构示例的框图。
     图 1 中的声音处理设备 10 包括麦克风 11、 信号处理单元 12、 放大器 13 和扬声器 14 ; 输入到麦克风 11 的声音通过抑制啸声而被放大, 然后从扬声器 14 输出。
     具体来说, 声音处理设备 10 的麦克风 11 收集环境声音, 并将该声音的音频信号提 供给信号处理单元 12。 信号处理单元 12 包括抑制滤波器 21 和特性计算单元 22。抑制滤波器 21 使用从 特性计算单元 22 提供的滤波器特征对从麦克风 11 提供的音频信号进行滤波, 并将该音频 信号提供给放大器 13。
     特性计算单元 22 使用从麦克风 11 提供的音频信号来计算抑制滤波器 21 的滤波 器特征, 并将该滤波器特征提供给抑制滤波器 21。这更新抑制滤波器 21。将参照后面示出 的图 2 对特性计算单元 22 的细节进行描述。
     放大器 13 对从抑制滤波器 21 提供的音频信号进行放大, 并将该音频信号提供给 扬声器 14。扬声器 14 输出与从放大器 13 提供的音频信号相对应的声音。
     [ 特性计算单元的详细结构示例 ]
     图 2 是示出图 1 中的特性计算单元 22 的详细结构示例的框图。
     图 2 中的特性计算单元 22 包括 FFT( 快速傅里叶变换 ) 运算单元 31、 功率谱运算 单元 32、 包络分量去除单元 33 以及滤波器特征计算单元 34。特性计算单元 22 逐帧地处理 从麦克风 11 提供的音频信号。
     FFT 运算单元 31 通过对从麦克风 11 提供的作为时域信号的音频信号进行 FFT 运 算将该音频信号转换为频域信号。FFT 运算单元 31 将该频域信号提供给功率谱运算单元 32。
     功率谱运算单元 32 计算从 FFT 运算单元 31 提供的频域信号的绝对平方值以获得 功率谱。功率谱运算单元 32 将该功率谱提供给包络分量去除单元 33。
     包络分量去除单元 33 从由功率谱运算单元 32 提供的功率谱中去除包络分量以生 成表示该功率谱的峰的信号特征。包络分量去除单元 33 将该信号特征提供给滤波器特征 计算单元 34。
     滤波器特征计算单元 34 通过使用从包络分量去除单元 33 提供的信号特征来计算 用于抑制该信号特征的滤波器特征。具体来说, 滤波器特征计算单元 34 使用以下公式 (1)
     至 (3) 中的任一个来计算滤波器特征。
     I(f) = -α·p(f) ...(1)
     在公式 (1) 至 (3) 中, p(f) 表示信号特征, I(f) 表示滤波器特征, α 是确定抑制 滤波器 21 的增益的系数。
     [ 对特性计算单元中的信号的说明 ]
     图 3A 至图 4C 示出了图 2 中的特性计算单元 22 中的信号。
     在图 3A 至图 4C 中, 横轴表示频率 (f), 纵轴表示音频信号的电平 (dB)。
     在图 2 中的特性计算单元 22 的包络分量去除单元 33 中, 从在图 3A 中用实线指示 的功率谱中去除在图 3A 中用虚线指示的包络分量以生成图 3B 中的信号特征。
     然后, 滤波器特征计算单元 34 例如使用图 3B 中的信号特征来进行公式 (1) 的运 算 (α = 1), 以计算图 3C 中的滤波器特征。
     去除包络分量的方法例如使用倒频谱。
     在该方法中, 首先对在图 4A 中用实线指示的功率谱 S(f) 的对数 (logS(f)) 进行 IFFT( 快速傅里叶逆变换 ), 并将该功率谱转换成图 4B 中的倒频谱。
     接下来, 在图 4B 中的倒频谱中, 虚线框内的低阶分量 ( 包络分量 ) 被设定为 0dB, 而实线框内的高阶分量不变。然后, 对所得到的倒频谱进行 FFT 运算。这生成作为信号特 征的功率谱, 从该功率谱中去除了图 4C 中的包络分量。
     [ 对由特性计算单元进行的处理的说明 ]
     图 5 是示出由图 2 中的特性计算单元 22 进行的滤波器特征计算的流程图。对例 如从麦克风 11 提供的音频信号逐帧地进行滤波器特征计算。
     在图 5 中的步骤 S11 中, FFT 运算单元 31 通过对从麦克风 11 提供的作为时域信 号的音频信号进行 FFT 运算将该音频信号转换成频域信号。 FFT 运算单元 31 将该频域信号 提供给功率谱运算单元 32。
     在步骤 S12 中, 功率谱运算单元 32 计算从 FFT 运算单元 31 提供的频域信号的绝 对平方值以获得功率谱。功率谱运算单元 32 将该功率谱提供给包络分量去除单元 33。
     在步骤 S13 中, 包络分量去除单元 33 从由功率谱运算单元 32 提供的功率谱中去 除包络分量以生成信号特征。包络分量去除单元 33 将该信号特征提供给滤波器特征计算 单元 34。
     在步骤 S14 中, 滤波器特征计算单元 34 通过利用从包络分量去除单元 33 提供的 信号特征进行公式 (1) 至 (3) 中的任一个来计算滤波器特征。然后, 处理结束。
     如上所述, 声音处理单元 10 获得音频信号的功率谱, 通过去除功率谱的包络分量 来生成信号特征, 通过使用信号特征来计算用于抑制和平坦化信号特征的滤波器特征, 并 使用滤波器特征对音频信号进行滤波。
     因此, 可以在发生啸声之前响应于发生的征兆逐渐地防止啸声发生。 另外, 利用音 频信号的信号特征自适应地更新抑制滤波器 21, 因此可以抑制必须抑制的频率的音频信号 的增益。如上所述, 可以高准确度地抑制啸声。
     [ 特性计算单元的另一个详细结构示例 ]
     图 6 是示出图 1 中的特性计算单元 22 的另一个详细结构示例的框图。
     在图 6 中的结构中, 与图 2 中相同的部件具有相同的附图标记。适当省略对其的 赘述。
     与图 2 中的结构不同的是, 图 6 中的特性计算单元 22 具有音调检测单元 51、 谐波 结构去除单元 52 和时间平均化单元 53。图 6 中的特性计算单元 22 计算滤波器特征, 用于 对从中去除了频率是声音音调的正整数倍的分量的信号特征进行时间平均化, 并用于抑制 所得到的信号特征。
     音调检测单元 51 对从功率谱运算单元 32 输出的功率谱的对数进行 IFFT 运算, 以 将该功率谱转换成倒频谱。音调检测单元 51 在与倒频谱的声音音调可以存在的频率相对 应的范围 ( 例如, 3.3ms 至 15ms) 中检测最高峰, 并采用该峰的频率作为声音音调的候选。 音调检测单元 51 获得音调的候选与处理对象帧的零阶倒频谱之间的比率, 并且如果该比 率等于或大于阈值, 则采用音调的候选作为音调。音调检测单元 51 将该音调提供给谐波结 构去除单元 52。 谐波结构去除单元 52 确定由包络分量去除单元 33 输出的信号特征是否具有这样 的谐波结构, 其中在是从音调检测单元 51 提供的音调的正整数倍的频率处存在峰。
     如果谐波结构去除单元 52 检测到信号特征具有该谐波结构, 则谐波结构去除单 元 52 将频率是信号特征音调的正整数倍的信号特征的分量确定为声音分量, 并将该分量 设定为 0dB。即, 信号特征的音调的分量和该音调的更高的谐波分量被设定为 0dB。然后, 谐波结构去除单元 52 将所得到的信号特征提供给时间平均化单元 53。要被谐波结构去除 单元 52 设定为 0dB 的分量除了音调的更高的谐波分量之外还可以包括边带频率的分量。
     时间平均化单元 53 保持从谐波结构去除单元 52 提供的信号特征。时间平均化单 元 53 使用从谐波结构去除单元 52 提供的处理对象帧的信号特征以及先前帧的信号特征对 信号特征进行时间平均化。
     例如, 时间平均化单元 53 使用以下公式 (4) 连同处理对象帧的信号特征 In(f) 和 处理对象帧的前一帧的信号特征 In-1(f) 一起对信号特征 In(f) 进行时间平均化。在公式 (4) 中, β 表示系数。
     In(f) = In-1(f)×β+In(f)×(1-β) ...(4)
     0≤β≤1
     根据公式 (4), 时间平均化之后的处理对象帧的信号特征 In(f) 由处理对象帧的信 号特征 In(f) 与处理对象帧的前一帧的信号特征 In-1(f) 的加权和来表示。
     公式 (4) 用于低阶 IIR 型时间平均化, 但是时间平均化单元 53 除了低阶 IIR 型时 间平均化之外还可以进行高阶 IIR 或 FIR 型时间平均化或非线性时间平均化。
     时间平均化单元 53 将经时间平均化的信号特征提供给滤波器特征计算单元 34。 其计算滤波器特征, 用于抑制经时间平均化的信号特征。
     [ 对特性计算单元中的信号的说明 ]
     图 7A 至图 7C 示出了图 6 中的特性计算单元 22 中的信号。
     在图 6 中的特性计算单元 22 的音调检测单元 51 中, 对功率谱的对数进行 IFFT 运 算, 以将该功率谱转换成图 7A 中的倒频谱。在倒频谱的声音音调可以存在的频率范围中检 测最高峰 P, 在图 7A 中该范围由实线框指示, 峰 P 的频率 fP 被用作声音音调的候选。然后, 获得声音音调的候选与零阶倒频谱之间的比率。在图 7A 至图 7C 的示例中, 该比率等于或 大于阈值, 从而作为音调的候选的频率 fP 被用作声音音调。
     谐波结构去除单元 52 检测图 7B 中的信号特征中频率是声音音调的正整数倍的分 量 fP、 2fP、 3fP、 4fP......。当分量具有如图 7B 中所示的峰时, 检测到信号特征具有音调谐 波结构, 并且所述分量被设定为 0dB。结果, 获得图 7C 中所示的信号特征。
     [ 对特性计算单元中的处理的说明 ]
     图 8 是示出由图 6 中的特性计算单元 22 进行的滤波器特征计算的流程图。对例 如从麦克风 11 提供的音频信号逐帧地进行该滤波器特征计算。
     在图 8 中的步骤 S31 中, FFT 运算单元 31 通过对从麦克风 11 提供的作为时域信 号的音频信号进行 FFT 运算将该音频信号转换成频域信号。然后, FFT 运算单元 31 将该频 域信号提供给功率谱运算单元 32。 在步骤 S32 中, 功率谱运算单元 32 计算从 FFT 运算单元 31 提供的频域信号的绝 对平方值以获得功率谱。功率谱运算单元 32 将该功率谱提供给包络分量去除单元 33 和音 调检测单元 51。
     在步骤 S33 中, 音调检测单元 51 使用从功率谱运算单元 32 提供的功率谱来检测 音调的候选。具体来说, 音调检测单元 51 对功率谱的对数进行 IFFT 运算以将该功率谱转 换成倒频谱。音调检测单元 51 在与倒频谱的声音音调可以存在的频率相对应的范围中检 测最高峰, 并采用峰的频率作为声音音调的候选。
     在步骤 S34 中, 包络分量去除单元 33 从由功率谱运算单元 32 提供的功率谱中去 除包络分量, 以生成信号特征。包络分量去除单元 33 将该信号特征提供给滤波器特征计算 单元 34。
     在步骤 S35 中, 音调检测单元 51 确定音调的候选与处理对象帧的零阶倒频谱之间 的比率是否等于或大于阈值。在步骤 S35 中如果该比率等于或大于阈值, 则音调检测单元 51 采用该候选作为音调并将其提供给谐波结构去除单元 52。
     在步骤 S36 中, 谐波结构去除单元 52 确定由包络分量去除单元 33 提供的信号特 征是否具有这样的谐波结构, 其中在是从音调检测单元 51 提供的音调的正整数倍的频率 处存在峰。
     在步骤 S36 中如果确定信号特征具有音调的谐波结构, 则在步骤 S37 中谐波结构 去除单元 52 将信号特征中频率是音调的正整数倍的分量设定为 0dB。然后, 谐波结构去除 单元 52 将所得到的信号特征提供给时间平均化单元 53, 并且处理进行到步骤 S38。
     如果在步骤 S35 中确定音调的候选与处理对象帧的零阶倒频谱之间的比率小于 阈值, 或者如果在步骤 S36 中信号特征不具有音调的谐波结构, 则谐波结构去除单元 52 将 由包络分量去除单元 33 生成的信号特征照原样提供给时间平均化单元 53。处理进行到步 骤 S38。
     在步骤 S38 中, 时间平均化单元 53 使用以上公式 (4) 连同处理对象帧的信号特征
     和处理对象帧的前一帧的信号特征一起对从谐波结构去除单元 52 提供的处理对象帧的信 号特征进行时间平均化。
     在步骤 S39 中, 滤波器特征计算单元 34 使用从时间平均化单元 53 提供的经时间 平均化的特性信号来计算滤波器特征, 并将结果提供给抑制滤波器 21( 图 1)。 然后, 处理结 束。
     如上所述, 在具有图 6 中的特性计算单元 22 的声音处理单元 10 中, 抑制滤波器 21 使用与经时间平均化的信号特征相对应的滤波器特征来进行滤波, 因此急剧地改变的其它 信号及音频信号未被抑制, 并且改善了从扬声器 14 输出的声音的质量。
     另外, 具有图 6 中的特性计算单元 22 的声音处理单元 10 检测声音音调并通过使 用其中频率是音调的正整数倍的分量被设定为 0dB 的信号特征来计算滤波器特征, 因此在 抑制滤波器 21 中, 声音音调的谐波结构未丢失。结果, 改善了从扬声器 14 输出的声音的质 量。
     [ 对根据本发明实施例的计算机的说明 ]
     可以通过硬件或软件来实现上述一系列处理。当通过软件来实现这一系列处理 时, 构成软件的程序安装在通用计算机等中。
     图 9 示出了其中安装有用于进行这一系列处理的程序的计算机的实施例的结构示例。 程序可以预先存储在作为计算机中的内置存储介质的存储单元 208 或 ROM( 只读 存储器 )202 中。
     程序还可以存储 ( 记录 ) 在可移动介质 211 上。这种类型的可移动介质 211 可 以被提供为所谓的套装软件。可移动介质 211 的示例是软盘、 CD-ROM( 只读光盘存储器 )、 MO( 磁光 ) 盘、 DVD( 数字多用途盘 )、 磁盘和半导体存储器。
     可以通过驱动器 210 从可移动介质 211 将程序安装在计算机中, 或者可以通过 通信网或广播网将程序下载到计算机来将程序安装在存储单元 208 中。即, 可以将程序 通过用于数字卫星广播的人造卫星从下载站点以无线方式传送到计算机, 或者通过诸如 LAN( 局域网 ) 或因特网的网络传送到计算机。
     计算机包括 CPU( 中央处理单元 )201, 输入 / 输出接口 205 通过总线 204 连接到 CPU 201。
     当用户通过操作输入单元 206 经由输入 / 输出接口 205 输入指令时, CPU 201 根 据该指令执行存储在 ROM 202 中的程序。可替选的是, CPU201 通过将程序加载到 RAM( 随 机存取存储器 )203 来执行存储在存储单元 208 中的程序。
     这使得 CPU 201 执行根据以上流程图的处理或者由以上框图中的结构进行的处 理。然后, 如果需要的话, CPU 201 通过输入 / 输出接口 205 将处理结果输出到输出单元 207, 从通信单元 209 发送处理结果, 或者将处理结果存储在存储单元 208 中。
     输入单元 206 包括键盘、 鼠标和麦克风。输出单元 207 包括 LCD( 液晶显示器 ) 和 扬声器。
     在本说明书中, 计算机在根据程序的处理过程中不必在时间顺序上遵循流程图的 顺序。即, 计算机根据程序进行的处理包括并行地或单独地进行的处理 ( 例如, 并行处理或 目标处理 )。
     程序可以通过一个计算机 ( 处理器 ) 来处理, 或者通过多个计算机分布式地处理。 程序可以被传送到远程计算机来执行。
     本申请包含与 2009 年 10 月 15 日提交日本专利局的日本优先权专利申请 JP 2009-238366 中所公开的主题相关的主题, 通过引用将其全部内容合并于此。
     本领域技术人员应当理解, 根据设计要求及其它因素可以想到各种修改、 组合、 子 组合和变更, 只要它们在所附权利要求书或其等同物的范围内即可。

声音处理设备、声音处理方法及声音处理程序.pdf_第1页
第1页 / 共17页
声音处理设备、声音处理方法及声音处理程序.pdf_第2页
第2页 / 共17页
声音处理设备、声音处理方法及声音处理程序.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《声音处理设备、声音处理方法及声音处理程序.pdf》由会员分享,可在线阅读,更多相关《声音处理设备、声音处理方法及声音处理程序.pdf(17页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102045621A43申请公布日20110504CN102045621ACN102045621A21申请号201010503344622申请日20100930200923836620091015JPH04R3/0220060171申请人索尼公司地址日本东京都72发明人花井早纪铃木三博74专利代理机构北京集佳知识产权代理有限公司11227代理人杜诚李春晖54发明名称声音处理设备、声音处理方法及声音处理程序57摘要本发明涉及声音处理设备、声音处理方法及声音处理程序。所述声音处理设备包括功率谱运算单元,获得音频信号的功率谱;包络分量去除单元,去除所述功率谱的包络分量并生成表示所述。

2、功率谱的峰的信号特征;滤波器特征计算单元,通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书7页附图8页CN102045625A1/1页21一种声音处理设备,包括功率谱运算装置,用于获得音频信号的功率谱;包络分量去除装置,用于去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算装置,用于通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。2根据权。

3、利要求1所述的声音处理设备,其中所述包络分量去除装置将所述功率谱转换成倒频谱,在所述倒频谱的低阶分量被设定成0的情况下进行逆转换,并且去除所述功率谱的所述包络分量。3根据权利要求1所述的声音处理设备,还包括时间平均化装置,用于对所述信号特征进行时间平均化,其中所述滤波器特征计算装置通过使用经所述时间平均化装置时间平均化的信号特征来计算所述滤波器特征。4根据权利要求1所述的声音处理设备,还包括音调检测装置,用于通过使用所述功率谱来检测所述音频信号的音调;以及谐波结构去除装置,用于在所述信号特征具有谐波结构时将所述信号特征的等于或接近于所述音调的正整数倍的频率分量设定成0,其中所述滤波器特征计算装。

4、置通过使用由所述谐波结构去除装置获得的所述信号特征来计算所述滤波器特征。5一种包含在声音处理单元中的声音处理方法,所述方法包括步骤获得音频信号的功率谱;去除所述功率谱的包络分量,并生成表示所述功率谱的峰的信号特征;通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征;以及通过使用所述滤波器特征对所述音频信号进行滤波。6一种使计算机进行处理的程序,所述处理包括步骤获得音频信号的功率谱;去除所述功率谱的包络分量,并生成表示所述功率谱的峰的信号特征;通过使用所述信号特征来计算用于抑制所述信号特征的滤波器特征;以及通过使用所述滤波器特征对所述音频信号进行滤波。7一种声音处理设备,包括功率谱运算单。

5、元,获得音频信号的功率谱;包络分量去除单元,去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算单元,通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,通过使用所述滤波器特征对所述音频信号进行滤波。权利要求书CN102045621ACN102045625A1/7页3声音处理设备、声音处理方法及声音处理程序技术领域0001本发明涉及声音处理设备、声音处理方法及声音处理程序,更具体地说,涉及一种能够高准确度地抑制啸声的声音处理设备、声音处理方法及声音处理程序。背景技术0002当由麦克风收集的声音经放大器放大然后从诸如扬声器的扩音系统输出时,所输出的声音通。

6、过空气传播,并被反馈给麦克风以形成闭环。取决于诸如音量或每个部件的位置的条件,音频信号的特定频率的振幅逐渐增大,导致称为啸声的振荡。0003自动抑制啸声的方法是,通过频率分析来检测发生啸声的频率以下称为啸声频率,并通过建立多个与啸声频率相对应的陷波滤波器来减小啸声频率的增益例如,参见日本未经审查的专利申请公报200949921号。发明内容0004然而,由于使用阈值来检测啸声频率,因此如果阈值低,则对啸声的响应快,但是有可能发生对啸声频率的检测错误,并且声音质量可能下降。0005如果阈值高,则啸声频率的检测错误减少并且声音质量改善,但是因为对啸声的响应慢,所以在啸声发生之后才将其抑制。0006对。

7、于误检测的啸声频率或不再发生啸声的啸声频率,可以释放陷波滤波器以抑制声音质量的下降,但是为此目的的控制是困难的。0007如上所述,现有技术的方法难以高准确度地抑制啸声。0008期望高准确度地抑制啸声。0009根据本发明的实施例,提供了一种声音处理设备,包括功率谱运算装置,用于获得音频信号的功率谱;包络分量去除装置,用于去除所述功率谱的包络分量并生成表示所述功率谱的峰的信号特征;滤波器特征计算装置,用于通过使用所述信号特征来计算抑制所述信号特征的滤波器特征;以及抑制滤波器,用于通过使用所述滤波器特征对所述音频信号进行滤波。0010根据本发明实施例的声音处理方法和声音处理程序与根据本发明实施例的声。

8、音处理设备相对应。0011在本发明的实施例中,获得音频信号的功率谱,去除功率谱的包络分量,生成表示功率谱的峰的信号特征,利用信号特征来计算用于抑制该信号特征的滤波器特征,并利用滤波器特征对声音特性进行滤波。0012根据本发明的实施例,可以高准确度地抑制啸声。附图说明0013图1是示出根据本发明实施例的声音处理设备的结构示例的框图。0014图2是示出图1中的特性计算单元的详细结构示例的框图。说明书CN102045621ACN102045625A2/7页40015图3A至图3C示出了图2中的特性计算单元中的信号。0016图4A至图4C示出了图2中的特性计算单元中的信号。0017图5是示出由图2中的。

9、特性计算单元进行的滤波器特征计算的流程图。0018图6是示出图1中的特性计算单元的另一个详细结构示例的框图。0019图7A至图7C示出了图6中的特性计算单元中的信号。0020图8是示出由图6中的特性计算单元进行的滤波器特征计算的流程图。0021图9是示出计算机的实施例的结构示例的框图。具体实施方式00220023声音处理设备的实施例的结构示例0024图1是示出根据本发明实施例的声音处理设备的结构示例的框图。0025图1中的声音处理设备10包括麦克风11、信号处理单元12、放大器13和扬声器14;输入到麦克风11的声音通过抑制啸声而被放大,然后从扬声器14输出。0026具体来说,声音处理设备10。

10、的麦克风11收集环境声音,并将该声音的音频信号提供给信号处理单元12。0027信号处理单元12包括抑制滤波器21和特性计算单元22。抑制滤波器21使用从特性计算单元22提供的滤波器特征对从麦克风11提供的音频信号进行滤波,并将该音频信号提供给放大器13。0028特性计算单元22使用从麦克风11提供的音频信号来计算抑制滤波器21的滤波器特征,并将该滤波器特征提供给抑制滤波器21。这更新抑制滤波器21。将参照后面示出的图2对特性计算单元22的细节进行描述。0029放大器13对从抑制滤波器21提供的音频信号进行放大,并将该音频信号提供给扬声器14。扬声器14输出与从放大器13提供的音频信号相对应的声。

11、音。0030特性计算单元的详细结构示例0031图2是示出图1中的特性计算单元22的详细结构示例的框图。0032图2中的特性计算单元22包括FFT快速傅里叶变换运算单元31、功率谱运算单元32、包络分量去除单元33以及滤波器特征计算单元34。特性计算单元22逐帧地处理从麦克风11提供的音频信号。0033FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进行FFT运算将该音频信号转换为频域信号。FFT运算单元31将该频域信号提供给功率谱运算单元32。0034功率谱运算单元32计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除。

12、单元33。0035包络分量去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量以生成表示该功率谱的峰的信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0036滤波器特征计算单元34通过使用从包络分量去除单元33提供的信号特征来计算用于抑制该信号特征的滤波器特征。具体来说,滤波器特征计算单元34使用以下公式1说明书CN102045621ACN102045625A3/7页5至3中的任一个来计算滤波器特征。0037IFPF1003800390040在公式1至3中,PF表示信号特征,IF表示滤波器特征,是确定抑制滤波器21的增益的系数。0041对特性计算单元中的信号的说。

13、明0042图3A至图4C示出了图2中的特性计算单元22中的信号。0043在图3A至图4C中,横轴表示频率F,纵轴表示音频信号的电平DB。0044在图2中的特性计算单元22的包络分量去除单元33中,从在图3A中用实线指示的功率谱中去除在图3A中用虚线指示的包络分量以生成图3B中的信号特征。0045然后,滤波器特征计算单元34例如使用图3B中的信号特征来进行公式1的运算1,以计算图3C中的滤波器特征。0046去除包络分量的方法例如使用倒频谱。0047在该方法中,首先对在图4A中用实线指示的功率谱SF的对数LOGSF进行IFFT快速傅里叶逆变换,并将该功率谱转换成图4B中的倒频谱。0048接下来,在。

14、图4B中的倒频谱中,虚线框内的低阶分量包络分量被设定为0DB,而实线框内的高阶分量不变。然后,对所得到的倒频谱进行FFT运算。这生成作为信号特征的功率谱,从该功率谱中去除了图4C中的包络分量。0049对由特性计算单元进行的处理的说明0050图5是示出由图2中的特性计算单元22进行的滤波器特征计算的流程图。对例如从麦克风11提供的音频信号逐帧地进行滤波器特征计算。0051在图5中的步骤S11中,FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进行FFT运算将该音频信号转换成频域信号。FFT运算单元31将该频域信号提供给功率谱运算单元32。0052在步骤S12中,功率谱运算单元32。

15、计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除单元33。0053在步骤S13中,包络分量去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量以生成信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0054在步骤S14中,滤波器特征计算单元34通过利用从包络分量去除单元33提供的信号特征进行公式1至3中的任一个来计算滤波器特征。然后,处理结束。0055如上所述,声音处理单元10获得音频信号的功率谱,通过去除功率谱的包络分量来生成信号特征,通过使用信号特征来计算用于抑制和平坦化信号特征的滤波器特征,并使用。

16、滤波器特征对音频信号进行滤波。说明书CN102045621ACN102045625A4/7页60056因此,可以在发生啸声之前响应于发生的征兆逐渐地防止啸声发生。另外,利用音频信号的信号特征自适应地更新抑制滤波器21,因此可以抑制必须抑制的频率的音频信号的增益。如上所述,可以高准确度地抑制啸声。0057特性计算单元的另一个详细结构示例0058图6是示出图1中的特性计算单元22的另一个详细结构示例的框图。0059在图6中的结构中,与图2中相同的部件具有相同的附图标记。适当省略对其的赘述。0060与图2中的结构不同的是,图6中的特性计算单元22具有音调检测单元51、谐波结构去除单元52和时间平均化。

17、单元53。图6中的特性计算单元22计算滤波器特征,用于对从中去除了频率是声音音调的正整数倍的分量的信号特征进行时间平均化,并用于抑制所得到的信号特征。0061音调检测单元51对从功率谱运算单元32输出的功率谱的对数进行IFFT运算,以将该功率谱转换成倒频谱。音调检测单元51在与倒频谱的声音音调可以存在的频率相对应的范围例如,33MS至15MS中检测最高峰,并采用该峰的频率作为声音音调的候选。音调检测单元51获得音调的候选与处理对象帧的零阶倒频谱之间的比率,并且如果该比率等于或大于阈值,则采用音调的候选作为音调。音调检测单元51将该音调提供给谐波结构去除单元52。0062谐波结构去除单元52确定。

18、由包络分量去除单元33输出的信号特征是否具有这样的谐波结构,其中在是从音调检测单元51提供的音调的正整数倍的频率处存在峰。0063如果谐波结构去除单元52检测到信号特征具有该谐波结构,则谐波结构去除单元52将频率是信号特征音调的正整数倍的信号特征的分量确定为声音分量,并将该分量设定为0DB。即,信号特征的音调的分量和该音调的更高的谐波分量被设定为0DB。然后,谐波结构去除单元52将所得到的信号特征提供给时间平均化单元53。要被谐波结构去除单元52设定为0DB的分量除了音调的更高的谐波分量之外还可以包括边带频率的分量。0064时间平均化单元53保持从谐波结构去除单元52提供的信号特征。时间平均化。

19、单元53使用从谐波结构去除单元52提供的处理对象帧的信号特征以及先前帧的信号特征对信号特征进行时间平均化。0065例如,时间平均化单元53使用以下公式4连同处理对象帧的信号特征INF和处理对象帧的前一帧的信号特征IN1F一起对信号特征INF进行时间平均化。在公式4中,表示系数。0066INFIN1FINF140067010068根据公式4,时间平均化之后的处理对象帧的信号特征INF由处理对象帧的信号特征INF与处理对象帧的前一帧的信号特征IN1F的加权和来表示。0069公式4用于低阶IIR型时间平均化,但是时间平均化单元53除了低阶IIR型时间平均化之外还可以进行高阶IIR或FIR型时间平均化。

20、或非线性时间平均化。0070时间平均化单元53将经时间平均化的信号特征提供给滤波器特征计算单元34。其计算滤波器特征,用于抑制经时间平均化的信号特征。0071对特性计算单元中的信号的说明说明书CN102045621ACN102045625A5/7页70072图7A至图7C示出了图6中的特性计算单元22中的信号。0073在图6中的特性计算单元22的音调检测单元51中,对功率谱的对数进行IFFT运算,以将该功率谱转换成图7A中的倒频谱。在倒频谱的声音音调可以存在的频率范围中检测最高峰P,在图7A中该范围由实线框指示,峰P的频率FP被用作声音音调的候选。然后,获得声音音调的候选与零阶倒频谱之间的比率。

21、。在图7A至图7C的示例中,该比率等于或大于阈值,从而作为音调的候选的频率FP被用作声音音调。0074谐波结构去除单元52检测图7B中的信号特征中频率是声音音调的正整数倍的分量FP、2FP、3FP、4FP。当分量具有如图7B中所示的峰时,检测到信号特征具有音调谐波结构,并且所述分量被设定为0DB。结果,获得图7C中所示的信号特征。0075对特性计算单元中的处理的说明0076图8是示出由图6中的特性计算单元22进行的滤波器特征计算的流程图。对例如从麦克风11提供的音频信号逐帧地进行该滤波器特征计算。0077在图8中的步骤S31中,FFT运算单元31通过对从麦克风11提供的作为时域信号的音频信号进。

22、行FFT运算将该音频信号转换成频域信号。然后,FFT运算单元31将该频域信号提供给功率谱运算单元32。0078在步骤S32中,功率谱运算单元32计算从FFT运算单元31提供的频域信号的绝对平方值以获得功率谱。功率谱运算单元32将该功率谱提供给包络分量去除单元33和音调检测单元51。0079在步骤S33中,音调检测单元51使用从功率谱运算单元32提供的功率谱来检测音调的候选。具体来说,音调检测单元51对功率谱的对数进行IFFT运算以将该功率谱转换成倒频谱。音调检测单元51在与倒频谱的声音音调可以存在的频率相对应的范围中检测最高峰,并采用峰的频率作为声音音调的候选。0080在步骤S34中,包络分量。

23、去除单元33从由功率谱运算单元32提供的功率谱中去除包络分量,以生成信号特征。包络分量去除单元33将该信号特征提供给滤波器特征计算单元34。0081在步骤S35中,音调检测单元51确定音调的候选与处理对象帧的零阶倒频谱之间的比率是否等于或大于阈值。在步骤S35中如果该比率等于或大于阈值,则音调检测单元51采用该候选作为音调并将其提供给谐波结构去除单元52。0082在步骤S36中,谐波结构去除单元52确定由包络分量去除单元33提供的信号特征是否具有这样的谐波结构,其中在是从音调检测单元51提供的音调的正整数倍的频率处存在峰。0083在步骤S36中如果确定信号特征具有音调的谐波结构,则在步骤S37。

24、中谐波结构去除单元52将信号特征中频率是音调的正整数倍的分量设定为0DB。然后,谐波结构去除单元52将所得到的信号特征提供给时间平均化单元53,并且处理进行到步骤S38。0084如果在步骤S35中确定音调的候选与处理对象帧的零阶倒频谱之间的比率小于阈值,或者如果在步骤S36中信号特征不具有音调的谐波结构,则谐波结构去除单元52将由包络分量去除单元33生成的信号特征照原样提供给时间平均化单元53。处理进行到步骤S38。0085在步骤S38中,时间平均化单元53使用以上公式4连同处理对象帧的信号特征说明书CN102045621ACN102045625A6/7页8和处理对象帧的前一帧的信号特征一起对。

25、从谐波结构去除单元52提供的处理对象帧的信号特征进行时间平均化。0086在步骤S39中,滤波器特征计算单元34使用从时间平均化单元53提供的经时间平均化的特性信号来计算滤波器特征,并将结果提供给抑制滤波器21图1。然后,处理结束。0087如上所述,在具有图6中的特性计算单元22的声音处理单元10中,抑制滤波器21使用与经时间平均化的信号特征相对应的滤波器特征来进行滤波,因此急剧地改变的其它信号及音频信号未被抑制,并且改善了从扬声器14输出的声音的质量。0088另外,具有图6中的特性计算单元22的声音处理单元10检测声音音调并通过使用其中频率是音调的正整数倍的分量被设定为0DB的信号特征来计算滤。

26、波器特征,因此在抑制滤波器21中,声音音调的谐波结构未丢失。结果,改善了从扬声器14输出的声音的质量。0089对根据本发明实施例的计算机的说明0090可以通过硬件或软件来实现上述一系列处理。当通过软件来实现这一系列处理时,构成软件的程序安装在通用计算机等中。0091图9示出了其中安装有用于进行这一系列处理的程序的计算机的实施例的结构示例。0092程序可以预先存储在作为计算机中的内置存储介质的存储单元208或ROM只读存储器202中。0093程序还可以存储记录在可移动介质211上。这种类型的可移动介质211可以被提供为所谓的套装软件。可移动介质211的示例是软盘、CDROM只读光盘存储器、MO磁。

27、光盘、DVD数字多用途盘、磁盘和半导体存储器。0094可以通过驱动器210从可移动介质211将程序安装在计算机中,或者可以通过通信网或广播网将程序下载到计算机来将程序安装在存储单元208中。即,可以将程序通过用于数字卫星广播的人造卫星从下载站点以无线方式传送到计算机,或者通过诸如LAN局域网或因特网的网络传送到计算机。0095计算机包括CPU中央处理单元201,输入/输出接口205通过总线204连接到CPU201。0096当用户通过操作输入单元206经由输入/输出接口205输入指令时,CPU201根据该指令执行存储在ROM202中的程序。可替选的是,CPU201通过将程序加载到RAM随机存取存。

28、储器203来执行存储在存储单元208中的程序。0097这使得CPU201执行根据以上流程图的处理或者由以上框图中的结构进行的处理。然后,如果需要的话,CPU201通过输入/输出接口205将处理结果输出到输出单元207,从通信单元209发送处理结果,或者将处理结果存储在存储单元208中。0098输入单元206包括键盘、鼠标和麦克风。输出单元207包括LCD液晶显示器和扬声器。0099在本说明书中,计算机在根据程序的处理过程中不必在时间顺序上遵循流程图的顺序。即,计算机根据程序进行的处理包括并行地或单独地进行的处理例如,并行处理或目标处理。说明书CN102045621ACN102045625A7/。

29、7页90100程序可以通过一个计算机处理器来处理,或者通过多个计算机分布式地处理。程序可以被传送到远程计算机来执行。0101本申请包含与2009年10月15日提交日本专利局的日本优先权专利申请JP2009238366中所公开的主题相关的主题,通过引用将其全部内容合并于此。0102本领域技术人员应当理解,根据设计要求及其它因素可以想到各种修改、组合、子组合和变更,只要它们在所附权利要求书或其等同物的范围内即可。说明书CN102045621ACN102045625A1/8页10图1说明书附图CN102045621ACN102045625A2/8页11图2图3A说明书附图CN102045621ACN102045625A3/8页12图3B图3C图4A图4B图4C说明书附图CN102045621ACN102045625A4/8页13图5说明书附图CN102045621ACN102045625A5/8页14图6图7A说明书附图CN102045621ACN102045625A6/8页15图7B图7C说明书附图CN102045621ACN102045625A7/8页16图8说明书附图CN102045621ACN102045625A8/8页17图9说明书附图CN102045621A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1