CN201310689407.5
2013.12.16
CN104715761A
2015.06.17
授权
有权
授权|||著录事项变更IPC(主分类):G10L 25/78变更事项:申请人变更前:深圳百科信息技术有限公司变更后:深圳市梦网百科信息技术有限公司变更事项:地址变更前:518057 广东省深圳市南山区粤海街道高新中四道30号龙泰利科技大厦325室变更后:518057 广东省深圳市南山区粤海街道高新中四道30号龙泰利科技大厦325室|||著录事项变更IPC(主分类):G10L 25/78变更事项:申请人变更前:深圳百科信息技术有限公司变更后:深圳百科信息技术有限公司变更事项:地址变更前:518057 广东省深圳市南山区科技园中区科苑路科兴科学园A1单元4楼403-405单位变更后:518057 广东省深圳市南山区粤海街道高新中四道30号龙泰利科技大厦325室|||实质审查的生效IPC(主分类):G10L 25/78申请日:20131216|||公开
G10L25/78(2013.01)I
G10L25/78
深圳百科信息技术有限公司
洪婷
518057广东省深圳市南山区科技园中区科苑路科兴科学园A1单元4楼403-405单位
本发明提出一种音频数据检测方法和系统。本发明方法可根据信噪比及系统的运算能力来自适应选择不同的检测方法,从而达到在抗噪性能及计算量上的优化实现。本发明方法不使用编码器的反馈信息,从而可适用于各类编码器。
1. 一种音频有效数据检测方法,其特征在于,所述方法包括以下步骤, S11:计算音频数据中前T帧音频的频域参数; S12:判断第T+1帧是否存在,若是,则进入步骤S13,否则结束; S13:将第T+1帧设置为当前待判定帧; S14:利用频域参数法进行音频有效数据检测; S15:进行信噪比估计; S16:判断是否为高信噪比,若是则进入S17; S17:利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 2. 如权利要求1所述的音频有效数据检测方法,其特征在于, 步骤S16中:判断是否为高信噪比,若否,则进入S18; S18:判断如果系统计算能力弱,则进入S19;否则,进入Step20; S19:利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15; S20:利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 3. 如权利要求1所述的音频有效数据检测方法,其特征在于,步骤S11之前还包括步骤 S10:对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 4. 如权利要求1所述的音频有效数据检测方法,其特征在于, 第t帧音频xt(n)频域参数MFCCt的计算方法如下: S111:进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k),1≤n≤N,N为帧长,1≤k≤N; 其中,xt(n)表示第t帧音频的第n个分量;Xt(k)表示第t帧音频对应频域帧的第k个分量; S112:将频域帧Xt(k)用一组三角滤波器进行滤波; S113:求出每个滤波器的输出对数能量; S114:获取频域参数MFCCt。 5. 如权利要求4所述的音频有效数据检测方法,其特征在于, 所述一组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 第m个三角滤波器频率响应为: 其中,Hm(k)为第m个三角滤波器的频率响应; fm为第m个滤波器的中心频率; Mel(fm)为fm对应的Mel频率, Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数; 所述“求出每个滤波器的输出对数能量”具体为 其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量; 所述“获取频域参数MFCCt”具体为: 6. 如权利要求1所述的音频有效数据检测方法,其特征在于,所述步骤S14中,“利用频域参数法进行音频有效数据检测”具体方法包括以下步骤, S140:令音频有效数据处理帧数等于1; S141:计算第一判定阈值, S142:对当前待判定帧进行预处理,然后计算当前待判定帧的频域参数; S143:判断是否当前待判定帧的频域参数大于第一判定阈值,若是则进入步骤S144,否则,进入步骤S148; S144:设置临时音频有效数据的起始帧为当前待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数; S145:判断是否所述连续帧数大于第二判定阈值,若是,则进入步骤S146,否则,进入步骤S148; S146,确认当前音频有效数据的起始帧即为临时音频有效数据起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,然后进入S147; S147:判断是否为第一次“利用频域参数法进行音频有效数据检测”,若是,则进入S15;若否,则进入Step148; S148:判定下一个待判定帧是否存在,若存在,则令下一个待判定帧为 当前待判定帧,,并令音频有效数据处理帧数加1,然后重新进入步骤S142;否则,结束。一般,第二判定阈值大于15。 7. 如权利要求6所述的音频有效数据检测方法,其特征在于, 所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包括以下步骤: S1441:令连续帧数等于1; S1442:判定下一个待判定帧是否存在,若是则进入步骤S1443,如果不存在,则结束; S1443:将下一个待判定帧设为当前待判定帧,并令音频有效数据处理帧数加1; S1444:计算当前待判定帧的频域参数;再判断是否当前判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入S1442,否则进入步骤S1445; S1445:设置临时音频有效数据的结束帧为当前待判定帧,进入步骤S145。 8. 如权利要求1所述的音频有效数据检测方法,其特征在于,所述步骤S15中,进行信噪比估计具体为: snr=10log((ex-en)/en), 其中,ex=mean((xt(n))2|xt(n)已进行过判断且为有效音频), snr为估计的信噪比,ex、en为中间变量;xt(n)表示第t帧音频的第n个分量; mean(变量|条件)表示对满足条件的变量求均值; log表示求以10为底的对数。 9. 如权利要求1所述的音频有效数据检测方法,其特征在于, 所述修正双门限法基本原理和双门限法相同,只是将幅值低门限修改为 幅值高门限修改为幅值低门限的2.5倍、过零率门限修改为max{min{25,μ+2σ},15}即可,μ和σ分别为根据最初T帧音频计算所得的幅值均值、能量均值、过零率均值和过零率标准差; 第四判定阈值大于第二判定阈值且小于“音频总帧数-T”。 10. 一种音频有效数据检测系统,其特征在于,所述系统包括: 第一频域参数计算模块,用于计算音频数据中前T帧音频的频域参数。其中,T≥10; 第一帧判断处理模块,用于判断第T+1帧是否存在,若是,则进入第一设置模块,否则结束; 第一设置模块,用于将第T+1帧设置为当前待判定帧; 音频有效数据检测装置,用于利用频域参数法进行音频有效数据检测; 信噪比评估模块,用于进行信噪比估计; 信噪比判断处理模块,用于判断是否为高信噪比,若是则进入双门限数据检测模块; 双门限数据检测模块,用于利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 11. 如权利要求10所述的音频有效数据检测系统,其特征在于,所述系统还包括, 信噪比判断处理模块,用于判断是否为高信噪比,若否,则进入系统计算能力判断处理模块; 系统计算能力判断处理模块,用于判断系统计算能力的强弱,若系统计算能力弱,则进入修正双门限数据检测模块,若系统计算能力强则进入频域参数数据检测模块; 修正双门限数据检测模块,用于利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块; 频域参数数据检测模块,用于利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 12. 如权利要求11所述的音频有效数据检测系统,其特征在于,所述音频有效数据检测系统还包括音频数据预处理模块, 音频数据预处理模块,用于对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 13. 如权利要求10所述的音频有效数据检测系统,其特征在于, 所述第一频域参数计算模块还包括频域帧获取模块、滤波模块、对数能量计算模块、频域参数获取模块, 频域帧获取模块,用于进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k),1≤n≤N,N为帧长;1≤k≤N; 滤波模块,用于将频域帧Xt(k)用一组三角滤波器进行滤波; 其中,该组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 第m个三角滤波器频率响应为: 其中,Hm(k)为第m个三角滤波器的频率响应; fm为第m个滤波器的中心频率; Mel(fm)为fm对应的Mel频率, Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数; 对数能量计算模块,用于求出每个滤波器的输出对数能量 其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量; 频域参数获取模块,用于获取频域参数MFCCt, 14. 如权利要求10所述的音频有效数据检测系统,其特征在于, 所述音频有效数据检测装置还包括音频有效数据处理帧设置模块、第一 判定阈值计算模块、预处理及频域参数计算模块、第一阈值判断处理模块、连续帧数统计模块、第二阈值判断处理模块、第一判断处理模块、第二帧判断处理模块、第二设置模块, 音频有效数据处理帧设置模块,用于令音频有效数据处理帧数等于1; 第一判定阈值计算模块、,用于计算第一判定阈值; 预处理及频域参数计算模块,用于对当前待判定帧进行预处理,然后计算当前待判定帧的频域参数; 第一阈值判断处理模块,用于判断是否当前待判定帧的频域参数大于第一判定阈值,若是则进入连续帧数统计模块,否则进入第二帧判断处理模块; 连续帧数统计模块,用于设置临时音频有效数据的起始帧为当前待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数; 第二阈值判断处理模块,用于判断是否所述连续帧数大于第二判定阈值,若是,则确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,进入第一判断处理模块,否则进入第二帧判断处理模块; 第一判断处理模块,用于判断是否为第一次“利用频域参数法进行音频有效数据检测”,若是,则进入信噪比评估模块;若否,则进入第二帧判断处理模块; 第二帧判断处理模块,用于判定下一个待判定帧是否存在,若存在,则进入第二设置模块,否则,结束; 第二设置模块,用于设置下一个待判定帧为当前待判定帧,并令音频有效数据处理帧数加1,然后重新进入预处理及频域参数计算模块。 15. 如权利要求14所述的音频有效数据检测系统,其特征在于, 所述连续帧数统计模块还包括第三设置模块、第三帧判断处理模块、第三阈值判断处理模块, 第三设置模块,用于令连续帧数等于1; 第三帧判断处理模块,用于判定下一个待判定帧是否存在,若是则将下一待判定帧设为当前待判定帧,并令音频有效数据处理帧数加1,如果不存在,则结束; 第三阈值判断处理模块,用于计算当前待判定帧的频域参数;再判断是 否当前判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入第三帧判断处理模块,否则设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,然后进入第二阈值判断处理模块。 16. 如权利要求10所述的音频有效数据检测系统,其特征在于, 所述信噪比评估模块中”进行信噪比估计”具体为: snr=10log((ex-en)/en), 其中ex=mean((xt(n))2|xt(n)已进行过判断且为有效音频), snr为估计的信噪比,ex、en为中间变量;xt(n)表示第t帧音频的第n个分量; mean(变量|条件)表示对满足条件的变量求均值; log表示求以10为底的对数;xt(n)表示第t帧音频。 17. 如权利要求10所述的音频有效数据检测系统,其特征在于, 修正双门限数据检测模块中,修正双门限法基本原理和双门限法相同,只是将幅值低门限修改为幅值高门限修改为幅值低门限的2.5倍、过零率门限修改为max{min{25,μ+2σ},15}即可,μ和σ分别为根据最初T帧音频计算所得的幅值均值、能量均值、过零率均值和过零率标准差;第四判定阈值大于第二判定阈值且小于“音频总帧数-T”。
一种音频有效数据检测方法和系统 技术领域 本发明涉及音频编解码领域,尤其涉及一种音频有效数据检测方法和系统。 背景技术 声音信息中一般存在长时间静音段,而人在讲话的时候,也会出现字、词、句之间的停顿。消除话音间隔及静音数据的冗余,则可使编码器更有效的利用有限的带宽。目前,常用的音频有效数据检测方法有双门限法、AMR-WB(Adaptive Multi-Rate Wideband)音频数据检测法。 其中,双门限法计算量小,但由于该方法中使用的能量参数在噪声环境中的不稳定性,使其在非高信噪比的音频数据检测上失去有效性。而后一种检测方法计算量大,而且需要编码器的反馈信息,从而制约了其在其他编码标准中的使用。 发明内容 本发明实施例的目的在于提出一种音频有效数据检测方法,旨在解决现有技术音频有效数据检测方法抗噪性能差或计算量大的问题。 本发明实施例是这样实现的,一种音频有效数据检测方法,所述方法包括以下步骤, S11:计算音频数据中前T帧音频的频域参数; S12:判断第T+1帧是否存在,若是,则进入步骤S13,否则结束; S13:将第T+1帧设置为当前待判定帧; S14:利用频域参数法进行音频有效数据检测; S15:进行信噪比估计; S16:判断是否为高信噪比,若是则进入S17; S17:利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15; 进一步地,步骤S16中:判断是否为高信噪比,若否,则进入S18; S18:判断如果系统计算能力弱,则进入S19;否则,进入Step20; S19:利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15; S20:利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 进一步地,步骤S11之前还包括步骤 S10:对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 本发明实施例的另一目的在于提出一种音频有效数据检测系统,所述系统包括: 第一频域参数计算模块,用于计算音频数据中前T帧音频的频域参数。其中,T≥10。 第一帧判断处理模块,用于判断第T+1帧是否存在,若是,则进入第一设置模块,否则结束。 第一设置模块,用于将第T+1帧设置为当前待判定帧。 音频有效数据检测装置,用于利用频域参数法进行音频有效数据检测。 信噪比评估模块,用于进行信噪比估计。 信噪比判断处理模块,用于判断是否为高信噪比,若是则进入双门限数据检测模块;双门限数据检测模块,用于利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 进一步地所述系统还包括, 信噪比判断处理模块,用于判断是否为高信噪比,若否,则进入系统计算能力判断处理模块。 系统计算能力判断处理模块,用于判断系统计算能力的强弱,若系统计算能力弱,则进入修正双门限数据检测模块,若系统计算能力强则进入频域参数数据检测模块。 修正双门限数据检测模块,用于利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 频域参数数据检测模块,用于利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模 块。 进一步地,所述音频有效数据检测系统还包括音频数据预处理模块, 音频数据预处理模块,用于对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 本发明的有益效果 本发明提出一种音频数据检测方法和系统。本发明根据信噪比及系统的运算能力来自适应选择不同的检测方法,从而达到在抗噪性能及计算量上的优化实现。此外,由于本发明不使用编码器的反馈信息,从而可适用于各类编码器。 附图说明 图1是本发明优选实施例的一种音频有效数据检测方法流程图; 图2是图1中步骤S11所包含的方法流程图; 图3是图1中步骤S14所包含的方法流程图; 图4是图3中步骤S144所包含的方法流程图; 图5是本发明优选实施例的一种音频有效数据检测系统结构图; 图6是图5中频域参数计算模块的结构图; 图7是图5中音频有效数据检测装置的结构图; 图8是图7中连续帧数统计模块的结构图。 具体实施方式 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明,为了便于说明,仅示出了与本发明实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本发明,并不用以限制本发明。 本发明实施例根据信噪比及系统的运算能力来自适应选择不同的检测方法,从而达到在抗噪性能及计算量上的优化实现。此外,由于本发明实施例方法不使用编码器的反馈信息,从而可适用于各类编码器。 实施例一 图1是本发明优选实施例的一种音频有效数据检测方法流程图;所述方法包括以下步骤: S10:对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 其中,预加重滤波器及窗口函数可选业内通用的任何一种方法。 S11:计算音频数据中前T帧音频的频域参数。其中,T≥10。 第t帧音频xt(n)频域参数MFCCt的计算方法如下(图2是图1中步骤S11所包含的方法流程图): S111:进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k),1≤n≤N,N为帧长;1≤k≤N。 S112:将频域帧Xt(k)用一组三角滤波器进行滤波。 其中,该组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 第m个三角滤波器频率响应为: Hm(k)=0,k≤fm-1k-fm-1fm-fm-1,fm-1≤k≤fmfm+1-kfm+1-fm,fm≤k≤fm+10,k≥fm+1,]]> 其中,Hm(k)为第m个三角滤波器的频率响应; fm为第m个滤波器的中心频率; Mel(fm)为fm对应的Mel频率, Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数。 S113:求出每个滤波器的输出对数能量 Yt(m)=ln(Σk=1N|Xt(k)|2Hm(k))]]> 其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量。 S114:获取频域参数MFCCt; MFCCt=Σm=1MYt(m)]]> S12:判断第T+1帧是否存在,若是,则进入步骤S13,否则结束; S13:将第T+1帧设置为当前待判定帧。 S14:利用频域参数法进行音频有效数据检测。 “利用频域参数法进行音频有效数据检测”具体方法包括以下步骤(图3是图1中步骤S14所包含的方法流程图): S140:令音频有效数据处理帧数等于1 S141:计算第一判定阈值。 S142:对当前待判定帧进行预处理,然后计算当前待判定帧的频域参数。 S143:判断是否当前待判定帧的频域参数大于第一判定阈值,若是则进入步骤S144,否则,进入步骤S148。 S144:设置临时音频有效数据的起始帧为当前待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数; 其中,所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包括以下步骤(图4是图3中步骤S144所包含的方法流程图): S1441:令连续帧数等于1; S1442:判定下一个待判定帧是否存在,若是则进入步骤S1443,如果不存在,则结束; S1443:将下一个待判定帧设为当前待判定帧,并令音频有效数据处理帧数加1; S1444:计算当前待判定帧的频域参数;再判断是否当前判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入S1442,否则进入步骤S1445; S1445:设置临时音频有效数据的结束帧为当前待判定帧,进入步骤S145。 S145:判断是否所述连续帧数大于第二判定阈值,若是,则进入步骤S146,否则,进入步骤S148。 S146,确认当前音频有效数据的起始帧即为临时音频有效数据起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,然后进入S147。 S147:判断是否为第一次“利用频域参数法进行音频有效数据检测”,若是,则进入S15;若否,则进入Step148。 S148:判定下一个待判定帧是否存在,若存在,则令下一个待判定帧为当前待判定帧,,并令音频有效数据处理帧数加1,然后重新进入步骤S142;否则,结束。一般,第二判定阈值大于15。 S15:进行信噪比估计。 snr=10log((ex-en)/en),其中ex=mean((xt(n))2|xt(n)已进行过判断且为有效音频), snr为估计的信噪比,ex、en为中间变量;xt(n)表示第t帧音频的第n个分量; 其中mean(变量|条件)表示对满足条件的变量求均值;log表示求以10为底的对数。 S16:判断是否为高信噪比(snr大于第三判定阈值),若是则进入S17;否则,则进入S18。 一般,第三判定阈值大于25。 S17:利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 其中,双门限法(基于幅值及过零率)为业内公知的检测方法。 一般,第四判定阈值大于第二判定阈值且小于“音频总帧数-T”。 S18:如果系统计算能力弱,则进入S19;否则,进入Step20。 系统计算能力强弱由应用平台的硬件条件确定,由使用方自行确定。 S19:利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 其中,修正双门限法,基本原理和双门限法相同,只是将幅值低门限修改为幅值高门限修改为幅值低门限的2.5倍、过零率门限修改为max{min{25,μ+2σ},15}即可,μ和σ分别为根据最初T帧音频计算所得的幅值均值、能量均值、过零率均值和过零率标准差; S20:利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入S15。 实施例二 图5是本发明优选实施例的一种音频有效数据检测系统结构图;所述系统包括: 第一频域参数计算模块,用于计算音频数据中前T帧音频的频域参数。其中,T≥10。 第一帧判断处理模块,用于判断第T+1帧是否存在,若是,则进入第一设置模块,否则结束。 第一设置模块,用于将第T+1帧设置为当前待判定帧。 音频有效数据检测装置,用于利用频域参数法进行音频有效数据检测。 信噪比评估模块,用于进行信噪比估计。 信噪比判断处理模块,用于判断是否为高信噪比(snr大于第三判定阈值),若是则进入双门限数据检测模块;否则,则进入系统计算能力判断处理模块。 双门限数据检测模块,用于利用双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 系统计算能力判断处理模块,用于判断系统计算能力的强弱,若系统计算能力弱,则进入修正双门限数据检测模块,若系统计算能力强则进入频域参数数据检测模块。 修正双门限数据检测模块,用于利用修正双门限法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 频域参数数据检测模块,用于利用频域参数法进行音频有效数据检测,直到音频有效数据处理帧数大于第四判定阈值,然后重新进入信噪比评估模块。 进一步地,所述音频有效数据检测系统还包括音频数据预处理模块, 音频数据预处理模块,用于对音频数据进行预处理,即依次进行常规的预加重滤波、分帧、加窗处理。 进一步地,所述第一频域参数计算模块还包括频域帧获取模块、滤波模块、对数能量计算模块、频域参数获取模块, 频域帧获取模块,用于进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k),1≤n≤N,N为帧长;1≤k≤N。 滤波模块,用于将频域帧Xt(k)用一组三角滤波器进行滤波。 其中,该组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 第m个三角滤波器频率响应为: Hm(k)=0,k≤fm-1k-fm-1fm-fm-1,fm-1≤k≤fmfm+1-kfm+1-fm,fm≤k≤fm+10,k≥fm+1,]]> 其中,Hm(k)为第m个三角滤波器的频率响应; fm为第m个滤波器的中心频率; Mel(fm)为fm对应的Mel频率, Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数。 对数能量计算模块,用于求出每个滤波器的输出对数能量 Yt(m)=ln(Σk=1N|Xt(k)|2Hm(k))]]> 其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量。 频域参数获取模块,用于获取频域参数MFCCt; MFCCt=Σm=1MYt(m).]]> 进一步地,所述音频有效数据检测装置还包括音频有效数据处理帧设置模块、第一判定阈值计算模块、预处理及频域参数计算模块、第一阈值判断处理模块、连续帧数统计模块、第二阈值判断处理模块、第一判断处理模块、第二帧判断处理模块、第二设置模块, 音频有效数据处理帧设置模块,用于令音频有效数据处理帧数等于1; 第一判定阈值计算模块、,用于计算第一判定阈值。 预处理及频域参数计算模块,用于对当前待判定帧进行预处理,然后计算当前待判定帧的频域参数。 第一阈值判断处理模块,用于判断是否当前待判定帧的频域参数大于第一判定阈值,若是则进入连续帧数统计模块,否则进入第二帧判断处理模块; 连续帧数统计模块,用于设置临时音频有效数据的起始帧为当前待判定 帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数; 第二阈值判断处理模块,用于判断是否所述连续帧数大于第二判定阈值,若是,则确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,进入第一判断处理模块,否则进入第二帧判断处理模块; 第一判断处理模块,用于判断是否为第一次“利用频域参数法进行音频有效数据检测”,若是,则进入信噪比评估模块;若否,则进入第二帧判断处理模块。 第二帧判断处理模块,用于判定下一个待判定帧是否存在,若存在,则进入第二设置模块,否则,结束。 第二设置模块,用于设置下一个待判定帧为当前待判定帧,并令音频有效数据处理帧数加1,然后重新进入预处理及频域参数计算模块; 进一步地,所述连续帧数统计模块还包括第三设置模块、第三帧判断处理模块、第三阈值判断处理模块, 第三设置模块,用于令连续帧数等于1; 第三帧判断处理模块,用于判定下一个待判定帧是否存在,若是则将下一待判定帧设为当前待判定帧,并令音频有效数据处理帧数加1,如果不存在,则结束; 第三阈值判断处理模块,用于计算当前待判定帧的频域参数;再判断是否当前判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入第三帧判断处理模块,否则设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,然后进入第二阈值判断处理模块; 进一步地,信噪比评估模块中”进行信噪比估计”具体为: snr=10log((ex-en)/en),其中ex=mean((xt(n))2|xt(n)已进行过判断且为有效音频), snr为估计的信噪比,ex、en为中间变量;xt(n)表示第t帧音频的第n个分量; 其中mean(变量|条件)表示对满足条件的变量求均值;log表示求以10为底的对数。xt(n)表示第t帧音频。 进一步地,修正双门限数据检测模块中,修正双门限法基本原理和双门限法相同,只是将幅值低门限修改为幅值高门限修改为幅值低门限的2.5倍、过零率门限修改为max{min{25,μ+2σ},15}即可,μ和σ分别为根据最初T帧音频计算所得的幅值均值、能量均值、过零率均值和过零率标准差;一般,第四判定阈值大于第二判定阈值且小于“音频总帧数-T”。 本领域的普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序指令相关硬件来完成的,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质可以为ROM、RAM、磁盘、光盘等。 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
《一种音频有效数据检测方法和系统.pdf》由会员分享,可在线阅读,更多相关《一种音频有效数据检测方法和系统.pdf(20页珍藏版)》请在专利查询网上搜索。
本发明提出一种音频数据检测方法和系统。本发明方法可根据信噪比及系统的运算能力来自适应选择不同的检测方法,从而达到在抗噪性能及计算量上的优化实现。本发明方法不使用编码器的反馈信息,从而可适用于各类编码器。 。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1