一种判断音乐噪声的方法以及语音消噪方法.pdf

上传人:Y94****206 文档编号:4573234 上传时间:2018-10-21 格式:PDF 页数:10 大小:458.99KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010219104.3

申请日:

2010.06.30

公开号:

CN102314883A

公开日:

2012.01.11

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G10L 21/02申请日:20100630|||公开

IPC分类号:

G10L21/02

主分类号:

G10L21/02

申请人:

比亚迪股份有限公司

发明人:

陈伟宾; 王进军; 庞泉晓

地址:

518118 广东省深圳市坪山新区比亚迪路3009号

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明提供了一种判断音乐噪声的方法,包括步骤A、对语音进行预处理;步骤B、求频域信号的功率谱;步骤C、选取特定的语音段作为噪声功率谱;步骤D、通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱,并将语音还原成时域语音信号;步骤E、通过正态分布计算静音段的均值与方差,并统计各帧的正态输出概率;步骤F、判断音乐噪声。以及一种语音消噪的方法,包括以上所述的判断音乐噪声的方法,还包括步骤G:消除音乐噪声。本发明实施例通过正态分布计算静音段的均值与方差,并统计各帧的正态输出概率判断音乐噪声,并依据判断的结果消除噪声,达到了较准确判断音乐噪声以及清楚噪声的效果。

权利要求书

1: 一种判断音乐噪声的方法, 其特征在于, 包括 步骤 A、 对语音进行预处理 ; 步骤 B、 求频域信号的功率谱 ; 步骤 C、 选取特定的语音段作为噪声功率谱 ; 步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将 语音还原成时域语音信号 ; 步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ; 步骤 F、 判断音乐噪声。
2: 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 [20, 100]ms 的语音段作为噪声功率谱。
3: 如权利要求 2 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 [20, 30]ms 的语音段作为噪声功率谱。
4: 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 A 中预处理包 括依次进行步骤 A1 分帧、 步骤 A2 加窗、 步骤 A3 预加重。
5: 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 D 包括 : 步骤 D1、 选取噪声功率谱 |D(k)| 与语音功率谱 |X(k)| 求得一帧中各点的谱减系数, 即 谱减系数为 : 其中 k ∈ [0, N-1], N 为帧长 ; 步骤 D2、 根据谱减系数对语音进行频域谱减 : S(k) = δk*X(k), X(k) 为带噪语音频域 信号, S(k) 为谱减后的语音频谱 ; 步骤 D3、 利用离散逆傅里叶变换将语音还原到时域 ; (0 ≤ k ≤ N-1) WN = exp(j2πnk/N) S(k) 表示谱减后的语音频谱, 步骤 D4、 取 表示时域语音数据, N 为帧长 ; 实数部分作为谱减后的语音信号。
6: 如权利要求 5 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 E 包括 : 步骤 E1、 于谱减后的语音信号中取特定语音段为静音 ; 步骤 E2、 设静音有 L 帧, 则: k ∈ [0, N-1] 其中 E(k) 表示 L 帧中每帧第 k 个点的均值, 表示第 l 帧的第 k 点的时域信号的 模; 步骤 E3、 根据一帧静音中各点的均值求各点的方差 : k ∈ [0, N-1] 2 D(k) 表示每帧第 k 点的方差, 表示第 l 帧的第 k 点的时域信号, E(k) 表示 L 帧中每 帧第 k 点的均值 ; 步骤 E4、 根据以上求得的均值和方差, 求每帧每个点的正态输出概率之和 : 其中 N 为帧长 ; 步骤 E5、 根据求得的均值和方差, 求静音段的帧平均正态输出概率 : 其中 N 为帧长, Pl 表示第 l 帧的概率之和, N 为帧长, xlk 表示第 l 帧第 k 个语音点。
7: 如权利要求 6 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 [20, 100]ms 的语音段作为静音。
8: 如权利要求 7 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 [20, 30]ms 的语音段作为静音。
9: 如权利要求 6 所述的一种判断音乐噪声的方法, 其特征在于还包括步骤 F、 取系数 α 否则不是音乐噪声。 与 β(α > β > 1), 当 βPs < P < αP 时则判断该帧为音乐噪声,
10: 如权利要求 9 所述的一种判断音乐噪声的方法, 其特征在于所述取系数 α = 3 与 β = 1.5(α > β > 1)。
11: 一种语音消噪的方法, 其特征在于包括如权利要求 1 至 10 任意一项所述的判断音 乐噪声的方法, 还包括步骤 G : 消除音乐噪声。
12: 如权利要求 11 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 E 消除音乐 噪声包括将所述音乐噪声部分的能量设置为 0。

说明书


一种判断音乐噪声的方法以及语音消噪方法

    技术领域 本发明属于语音信号处理领域, 尤其涉及一种通过算法判断音乐噪声以及消除语 音中所带噪声的方法。
     背景技术 语音不仅是人与人之间交流的信息载体而且在现代通信系统中扮演着至关重要 的角色。由于噪声的干扰, 正常语音往往会失去可懂度造成质量下降。通信系统和语音数 字信号处理也会由于噪声的存在而产生极大的误差, 从而给科研以及产品开发带来不利影 响。因此消除噪声干扰、 增强语音质量越来越受人们的重视。
     消噪的技术包括基于短时谱估计的语音增强算法有幅度谱相减法、 功率谱相减 法、 维纳滤波法、 最小均方差法等。
     发明内容 本发明为解决尽可能消除音乐噪声的技术问题, 提供一种判断音乐噪声的方法以 及语音消噪方法。
     一种判断音乐噪声的方法, 包括
     步骤 A、 对语音进行预处理 ;
     步骤 B、 求频域信号的功率谱 ;
     步骤 C、 选取特定的语音段作为噪声功率谱 ;
     步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将语音还原成时域语音信号 ;
     步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ;
     步骤 F、 判断音乐噪声。
     一种语音消噪的方法, 包括以上所述的判断音乐噪声的方法, 还包括步骤 G : 消除 音乐噪声。
     本发明通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率判断 音乐噪声, 并依据判断的结果消除噪声, 达到了较准确判断音乐噪声以及清楚噪声的效果。
     附图说明
     图 1 为本发明实施例判断音乐噪声以及消除噪声的示意图 图 2 为图 1 的具体流程示意图 图 3 为原始语音信号 图 4 为现有技术谱减算法得到的语音信号 图 5 为本发明实施例消噪后得到的语音信号具体实施方式为了使本发明所解决的技术问题、 技术方案及有益效果更加清楚明白, 以下结合 实施例, 对本发明进行进一步详细说明。 应当理解, 此处所描述的具体实施例仅仅用以解释 本发明, 并不用于限定本发明。
     如图 1 所示本发明实施例的语音消噪方法包括 :
     步骤 A、 对语音进行预处理 ;
     步骤 B、 求频域信号的功率谱 ;
     步骤 C、 选取特定的语音段作为噪声功率谱 ;
     步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将语音还原成时域语音信号 ;
     步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ;
     步骤 F、 判断音乐噪声。
     下面通过图 2 具体的介绍本发明的实施例。如图 2 所示, 所述步骤 A 中所述预处 理包括依次进行步骤 A1 分帧、 步骤 A2 加窗、 步骤 A3 预加重。
     具体的, 步骤 A1、 分帧遵照每帧 256 点, 帧移为 80 点的原则。
     步骤 A2、 加窗指将每帧语音数据分别乘以相应的窗系数, 窗长为 256 点。 窗系数由 下面公式求得 :
     其中 N 为窗长
     步骤 A3、 对语音信号进行预加重, 预加重系数为 0.9 ~ 1 之间的值。
     预加重的目的是为了提升高频部分, 使信号的频谱变得平坦, 保持在低频到高频 的整个频带中, 能用同样的信噪比求频谱, 以便于频谱分析或声道参数分析。通俗的说, 预 加重部分就是设计数字滤波器, 常采用的是 :
     H(z) = 1-u/z
     其中, u 取接近于 1 的值, 因此预加重系数常取 0.9 ~ 1 之间的值。其具体实施如 下:
     x(0) = (1-0.97)*x(0) (8)
     其中 N 为帧长, x(k) 表示一帧语音的第 k 个点。
     优选的, 所述预加重系数设定为 0.97, 可以使得信号的频谱变得更加平坦。
     所述步骤 B 求频域语音信号的功率谱包括利用离散傅里叶变换求频域语音信号 功率谱,
     WN = exp(-j2πnk/N) 其中 N 为帧长。所述步骤 C、 于步骤 B 所得频域语音信号功率谱中选取特定的语音段作为噪声功 率谱。所述特定的语音段可取 [20, 100]ms。
     优选的, 取前 [20, 30]ms 的语音段作为噪声功率谱, 可以获得一个较准确的噪声 功率谱。
     所述步骤 D 包括 :
     步骤 D1、 利用噪声功率谱 |D(k)| 与语音功率谱 |X(k)| 求得一帧中各点的谱减系 数, 即谱减系数为 :
     其中 k ∈ [0, N-1], N 为帧长 ;步骤 D2、 根据谱减系数对语音进行频域谱减 : S(k) = δk*X(k), X(k) 为带噪语音 频域信号, S(xn) 为谱减后语音频谱 ;
     步骤 D3、 利用离散逆傅里叶变换后将语音还原到时域 ;
     (0 ≤ k ≤ N-1) WN = exp(j2πnk/N) S(xn) 表示谱减后的语音频谱, 步骤 D4、 取 表示时域语音数据, N 为帧长 ;实数部分作为谱减后的语音信号。具体的, 所述步骤 E 包括 :
     步骤 E1、 于谱减后的语音信号中取特定语音段为静音。
     具体的, 所述步骤 E1 中取前 [20, 100]ms 的语音段作为静音。优选的, 取前 [20, 30]ms 的语音段作为静音。
     步骤 E2、 设静音有 L 帧, 则:
     k ∈ [0, N-1]
     其中 E(k) 表示 L 帧中每帧第 k 个点的均值,表示第 l 帧的第 k 点的时域信号的模 ;
     步骤 E3、 根据一帧静音中各点的均值求各点的方差 :
     D(k) 表示每帧第 k 点的方差, 表示第 l 帧的第 k 点的时域信号, E(k) 表示 L 帧中每帧第 k 点的均值 ;
     步骤 E4、 根据以上求得的均值和方差, 求每帧每个点的正态输出概率之和 :
     其中 N 为帧长 ; 步骤 E5、 根据求得的均值和方差, 求静音段的帧平均正态输出概率 :其中 N 为帧长, Pl 表示第 l 帧的概率之和, N 为帧长, xlk 表示第 l 帧第 k 个语音点; 步骤 F、 取系数 α 与 β(α > β > 1), 当 βP < Pl < αP 时则判断该帧为音乐 噪声, 否则不是音乐噪声。
     根据噪声与语音能力统计实验可得, 所述 α 可选 [2.0, 3.5], 所述 β 可选 [0.8, 1.8], 可以更准确地判断出音乐噪声。
     优选的, 所述系数 α = 3 及 β = 1.5 得到最准确的音乐噪声判断。
     步骤 G、 消除音乐噪声, 将判断为音乐噪声部分的能量置为 0, 这样就得到纯净语音。 本发明实施例提出了一种基于谱减和分布统计的消噪方法, 首先用谱减法消除语 音噪声, 然后利用分布统计规律提炼出产生音乐噪声的语音帧, 最后消除音乐噪声以达到 好的消噪效果。如图 3 至图 5 比较可以看出, 原始语音具有大量的噪声, 通过谱减法虽然能 消除部分的噪声, 但是会留下部分音乐噪声。本发明实施例在谱减消噪后通过利用分布统 计规律提炼出产生音乐噪声的语音帧, 最后消除音乐噪声以达到好的消噪效果。
     以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本发明的保护范围之内。
    

一种判断音乐噪声的方法以及语音消噪方法.pdf_第1页
第1页 / 共10页
一种判断音乐噪声的方法以及语音消噪方法.pdf_第2页
第2页 / 共10页
一种判断音乐噪声的方法以及语音消噪方法.pdf_第3页
第3页 / 共10页
点击查看更多>>
资源描述

《一种判断音乐噪声的方法以及语音消噪方法.pdf》由会员分享,可在线阅读,更多相关《一种判断音乐噪声的方法以及语音消噪方法.pdf(10页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102314883 A (43)申请公布日 2012.01.11 CN 102314883 A *CN102314883A* (21)申请号 201010219104.3 (22)申请日 2010.06.30 G10L 21/02(2006.01) (71)申请人 比亚迪股份有限公司 地址 518118 广东省深圳市坪山新区比亚迪 路 3009 号 (72)发明人 陈伟宾 王进军 庞泉晓 (54) 发明名称 一种判断音乐噪声的方法以及语音消噪方法 (57) 摘要 本发明提供了一种判断音乐噪声的方法, 包 括步骤 A、 对语音进行预处理 ; 步骤 B、 求频域信号 的功。

2、率谱 ; 步骤 C、 选取特定的语音段作为噪声功 率谱 ; 步骤 D、 通过带噪语音以及噪声功率谱进行 谱减得到带有音乐噪声的语音功率谱, 并将语音 还原成时域语音信号 ; 步骤 E、 通过正态分布计算 静音段的均值与方差, 并统计各帧的正态输出概 率 ; 步骤 F、 判断音乐噪声。以及一种语音消噪的 方法, 包括以上所述的判断音乐噪声的方法, 还包 括步骤G : 消除音乐噪声。 本发明实施例通过正态 分布计算静音段的均值与方差, 并统计各帧的正 态输出概率判断音乐噪声, 并依据判断的结果消 除噪声, 达到了较准确判断音乐噪声以及清楚噪 声的效果。 (51)Int.Cl. (19)中华人民共和。

3、国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 4 页 附图 3 页 CN 102314888 A1/2 页 2 1. 一种判断音乐噪声的方法, 其特征在于, 包括 步骤 A、 对语音进行预处理 ; 步骤 B、 求频域信号的功率谱 ; 步骤 C、 选取特定的语音段作为噪声功率谱 ; 步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将 语音还原成时域语音信号 ; 步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ; 步骤 F、 判断音乐噪声。 2. 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C。

4、 中取前 20, 100ms 的语音段作为噪声功率谱。 3. 如权利要求 2 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 20, 30ms 的语音段作为噪声功率谱。 4. 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 A 中预处理包 括依次进行步骤 A1 分帧、 步骤 A2 加窗、 步骤 A3 预加重。 5. 如权利要求 1 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 D 包括 : 步骤D1、 选取噪声功率谱|D(k)|与语音功率谱|X(k)|求得一帧中各点的谱减系数, 即 谱减系数为 :其中 k 0, N-1, N 为帧长 ; 步骤 D2、 。

5、根据谱减系数对语音进行频域谱减 : S(k) k*X(k), X(k) 为带噪语音频域 信号, S(k) 为谱减后的语音频谱 ; 步骤 D3、 利用离散逆傅里叶变换将语音还原到时域 ; (0 k N-1) WN exp(j2nk/N) S(k) 表示谱减后的语音频谱,表示时域语音数据, N 为帧长 ; 步骤 D4、 取实数部分作为谱减后的语音信号。 6. 如权利要求 5 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 E 包括 : 步骤 E1、 于谱减后的语音信号中取特定语音段为静音 ; 步骤 E2、 设静音有 L 帧, 则 : k 0, N-1 其中 E(k) 表示 L 帧中每帧第 k 。

6、个点的均值,表示第 l 帧的第 k 点的时域信号的 模 ; 步骤 E3、 根据一帧静音中各点的均值求各点的方差 : k 0, N-1 权 利 要 求 书 CN 102314883 A CN 102314888 A2/2 页 3 D(k) 表示每帧第 k 点的方差,表示第 l 帧的第 k 点的时域信号, E(k) 表示 L 帧中每 帧第 k 点的均值 ; 步骤 E4、 根据以上求得的均值和方差, 求每帧每个点的正态输出概率之和 : 其中 N 为帧长 ; 步骤 E5、 根据求得的均值和方差, 求静音段的帧平均正态输出概率 : 其中 N 为帧长, Pl表示第 l 帧的概率之和, N 为帧长, xlk。

7、表示第 l 帧第 k 个语音点。 7. 如权利要求 6 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 20, 100ms 的语音段作为静音。 8. 如权利要求 7 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 C 中取前 20, 30ms 的语音段作为静音。 9.如权利要求6所述的一种判断音乐噪声的方法, 其特征在于还包括步骤F、 取系数 与 ( 1), 当 Ps P P 时则判断该帧为音乐噪声, 否则不是音乐噪声。 10. 如权利要求 9 所述的一种判断音乐噪声的方法, 其特征在于所述取系数 3 与 1.5( 1)。 11. 一种语音消噪的方法, 其特征在于包括如权利。

8、要求 1 至 10 任意一项所述的判断音 乐噪声的方法, 还包括步骤 G : 消除音乐噪声。 12. 如权利要求 11 所述的一种判断音乐噪声的方法, 其特征在于所述步骤 E 消除音乐 噪声包括将所述音乐噪声部分的能量设置为 0。 权 利 要 求 书 CN 102314883 A CN 102314888 A1/4 页 4 一种判断音乐噪声的方法以及语音消噪方法 技术领域 0001 本发明属于语音信号处理领域, 尤其涉及一种通过算法判断音乐噪声以及消除语 音中所带噪声的方法。 背景技术 0002 语音不仅是人与人之间交流的信息载体而且在现代通信系统中扮演着至关重要 的角色。由于噪声的干扰, 正。

9、常语音往往会失去可懂度造成质量下降。通信系统和语音数 字信号处理也会由于噪声的存在而产生极大的误差, 从而给科研以及产品开发带来不利影 响。因此消除噪声干扰、 增强语音质量越来越受人们的重视。 0003 消噪的技术包括基于短时谱估计的语音增强算法有幅度谱相减法、 功率谱相减 法、 维纳滤波法、 最小均方差法等。 发明内容 0004 本发明为解决尽可能消除音乐噪声的技术问题, 提供一种判断音乐噪声的方法以 及语音消噪方法。 0005 一种判断音乐噪声的方法, 包括 0006 步骤 A、 对语音进行预处理 ; 0007 步骤 B、 求频域信号的功率谱 ; 0008 步骤 C、 选取特定的语音段作为。

10、噪声功率谱 ; 0009 步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将语音还原成时域语音信号 ; 0010 步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ; 0011 步骤 F、 判断音乐噪声。 0012 一种语音消噪的方法, 包括以上所述的判断音乐噪声的方法, 还包括步骤 G : 消除 音乐噪声。 0013 本发明通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率判断 音乐噪声, 并依据判断的结果消除噪声, 达到了较准确判断音乐噪声以及清楚噪声的效果。 附图说明 0014 图 1 为本发明实施例判断音乐噪声以及消。

11、除噪声的示意图 0015 图 2 为图 1 的具体流程示意图 0016 图 3 为原始语音信号 0017 图 4 为现有技术谱减算法得到的语音信号 0018 图 5 为本发明实施例消噪后得到的语音信号 具体实施方式 说 明 书 CN 102314883 A CN 102314888 A2/4 页 5 0019 为了使本发明所解决的技术问题、 技术方案及有益效果更加清楚明白, 以下结合 实施例, 对本发明进行进一步详细说明。 应当理解, 此处所描述的具体实施例仅仅用以解释 本发明, 并不用于限定本发明。 0020 如图 1 所示本发明实施例的语音消噪方法包括 : 0021 步骤 A、 对语音进行。

12、预处理 ; 0022 步骤 B、 求频域信号的功率谱 ; 0023 步骤 C、 选取特定的语音段作为噪声功率谱 ; 0024 步骤 D、 通过带噪语音以及噪声功率谱进行谱减得到带有音乐噪声的语音功率谱, 并将语音还原成时域语音信号 ; 0025 步骤 E、 通过正态分布计算静音段的均值与方差, 并统计各帧的正态输出概率 ; 0026 步骤 F、 判断音乐噪声。 0027 下面通过图 2 具体的介绍本发明的实施例。如图 2 所示, 所述步骤 A 中所述预处 理包括依次进行步骤 A1 分帧、 步骤 A2 加窗、 步骤 A3 预加重。 0028 具体的, 步骤 A1、 分帧遵照每帧 256 点, 帧。

13、移为 80 点的原则。 0029 步骤A2、 加窗指将每帧语音数据分别乘以相应的窗系数, 窗长为256点。 窗系数由 下面公式求得 : 0030 0031 其中 N 为窗长 0032 步骤 A3、 对语音信号进行预加重, 预加重系数为 0.9 1 之间的值。 0033 预加重的目的是为了提升高频部分, 使信号的频谱变得平坦, 保持在低频到高频 的整个频带中, 能用同样的信噪比求频谱, 以便于频谱分析或声道参数分析。通俗的说, 预 加重部分就是设计数字滤波器, 常采用的是 : 0034 H(z) 1-u/z 0035 其中, u 取接近于 1 的值, 因此预加重系数常取 0.9 1 之间的值。其。

14、具体实施如 下 : 0036 x(0) (1-0.97)*x(0) (8) 0037 0038 其中 N 为帧长, x(k) 表示一帧语音的第 k 个点。 0039 优选的, 所述预加重系数设定为 0.97, 可以使得信号的频谱变得更加平坦。 0040 所述步骤 B 求频域语音信号的功率谱包括利用离散傅里叶变换求频域语音信号 功率谱, 0041 0042 WN exp(-j2nk/N) 0043 其中 N 为帧长。 说 明 书 CN 102314883 A CN 102314888 A3/4 页 6 0044 所述步骤 C、 于步骤 B 所得频域语音信号功率谱中选取特定的语音段作为噪声功 率谱。

15、。所述特定的语音段可取 20, 100ms。 0045 优选的, 取前 20, 30ms 的语音段作为噪声功率谱, 可以获得一个较准确的噪声 功率谱。 0046 所述步骤 D 包括 : 0047 步骤 D1、 利用噪声功率谱 |D(k)| 与语音功率谱 |X(k)| 求得一帧中各点的谱减系 数, 即谱减系数为 :其中 k 0, N-1, N 为帧长 ; 0048 步骤 D2、 根据谱减系数对语音进行频域谱减 : S(k) k*X(k), X(k) 为带噪语音 频域信号, S(xn) 为谱减后语音频谱 ; 0049 步骤 D3、 利用离散逆傅里叶变换后将语音还原到时域 ; 0050 (0 k N。

16、-1) 0051 WN exp(j2nk/N) 0052 S(xn) 表示谱减后的语音频谱,表示时域语音数据, N 为帧长 ; 0053 步骤 D4、 取实数部分作为谱减后的语音信号。 0054 具体的, 所述步骤 E 包括 : 0055 步骤 E1、 于谱减后的语音信号中取特定语音段为静音。 0056 具体的, 所述步骤 E1 中取前 20, 100ms 的语音段作为静音。优选的, 取前 20, 30ms 的语音段作为静音。 0057 步骤 E2、 设静音有 L 帧, 则 : 0058 k 0, N-1 0059 其中 E(k) 表示 L 帧中每帧第 k 个点的均值,表示第 l 帧的第 k 。

17、点的时域信 号的模 ; 0060 步骤 E3、 根据一帧静音中各点的均值求各点的方差 : 0061 0062 D(k) 表示每帧第 k 点的方差,表示第 l 帧的第 k 点的时域信号, E(k) 表示 L 帧 中每帧第 k 点的均值 ; 0063 步骤 E4、 根据以上求得的均值和方差, 求每帧每个点的正态输出概率之和 : 说 明 书 CN 102314883 A CN 102314888 A4/4 页 7 0064 0065 其中 N 为帧长 ; 0066 步骤 E5、 根据求得的均值和方差, 求静音段的帧平均正态输出概率 : 0067 0068 其中 N 为帧长, Pl表示第 l 帧的概率。

18、之和, N 为帧长, xlk表示第 l 帧第 k 个语音 点 ; 0069 步骤 F、 取系数 与 ( 1), 当 P Pl P 时则判断该帧为音乐 噪声, 否则不是音乐噪声。 0070 根据噪声与语音能力统计实验可得, 所述 可选 2.0, 3.5, 所述 可选 0.8, 1.8, 可以更准确地判断出音乐噪声。 0071 优选的, 所述系数 3 及 1.5 得到最准确的音乐噪声判断。 0072 步骤 G、 消除音乐噪声, 将判断为音乐噪声部分的能量置为 0, 这样就得到纯净语 音。 0073 本发明实施例提出了一种基于谱减和分布统计的消噪方法, 首先用谱减法消除语 音噪声, 然后利用分布统计。

19、规律提炼出产生音乐噪声的语音帧, 最后消除音乐噪声以达到 好的消噪效果。如图 3 至图 5 比较可以看出, 原始语音具有大量的噪声, 通过谱减法虽然能 消除部分的噪声, 但是会留下部分音乐噪声。本发明实施例在谱减消噪后通过利用分布统 计规律提炼出产生音乐噪声的语音帧, 最后消除音乐噪声以达到好的消噪效果。 0074 以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本发明的保护范围之内。 说 明 书 CN 102314883 A CN 102314888 A1/3 页 8 图 1 说 明 书 附 图 CN 102314883 A CN 102314888 A2/3 页 9 图 2 图 3 说 明 书 附 图 CN 102314883 A CN 102314888 A3/3 页 10 图 4 图 5 说 明 书 附 图 CN 102314883 A 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 乐器;声学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1