《录音地点的识别方法.pdf》由会员分享,可在线阅读,更多相关《录音地点的识别方法.pdf(12页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104102834A43申请公布日20141015CN104102834A21申请号201410329137122申请日20140710G06F19/00201101G06N3/0220060171申请人南京工程学院地址211167江苏省南京市江宁科学园弘景大道1号72发明人王学强吉建梅74专利代理机构南京正联知识产权代理有限公司32243代理人沈志海54发明名称录音地点的识别方法57摘要本发明提供一种录音地点的识别方法,包含以下几个部分电网频率数据降维、音频中电网频率提取、BP神经网络识别模型的建立、模拟退火搜索识别结果、将识别结果转换为具体地点。该方法解决了传统音频取证方。
2、法无法识别录音地点的问题;采用BP神经网络作为主要识别方法,效率高;采用KDA降维算法,使识别速度加快;模拟退火搜索识别结果,迅速确定录音地点;本发明基于BP神经网络,利用电网频率作为识别依据,解决了传统方法无法识别录音地点的难题。51INTCL权利要求书1页说明书6页附图4页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书6页附图4页10申请公布号CN104102834ACN104102834A1/1页21一种录音地点的识别方法,其特征在于,S1、构建BP神经网络;S2、将各地的电网频率数据作KDA降维处理,以满足BP神经网络的输入要求;S3、将处理后的电网频率数据作为训。
3、练样本训练BP神经网络;S4、提取录音中的电网频率数据,具体为将需要识别的录音先进行300HZ低通滤波,然后加重信号,接着进行窄带滤波,最后经过测频算法;S5、将录音中的电网频率数据作KDA降维处理;S6、将S5中处理好的数据输入到已经完成训练的BP神经网络进行识别;S7、用模拟退火算法搜索识别结果,并转换为具体地点。2如权利要求1所述录音地点的识别方法,其特征在于电网频率数据为X1,X2,X3XN,通过一个映射F,将数据从N维空间映射到NNN维空间中;KDA降维算法公式如下KXI,XJFXITFXJ;其中,径向基核函数为KXI,XJEXP|XIXJ|2/22。3如权利要求1所述录音地点的识别。
4、方法,其特征在于所述步骤S4中,录音中电网频率提取是先经过300HZ低通滤波,然后对信号作加重处理,接着经过49HZ51HZ的窄带滤波,最后经过测频算法测频。4如权利要求3所述录音地点的识别方法,其特征在于所述低通滤波采用的是巴特沃兹滤波器,所述窄带滤波采用的是椭圆滤波器。5如权利要求14任一项所述录音地点的识别方法,其特征在于所述步骤S7中,对N个地点,BP输出结果分别为SN,采用模拟退火算法,搜索其中的MAXSN,以确定录音的地点。6如权利要求5所述录音地点的识别方法,其特征在于,模拟退火算法搜索识别结果步骤如下S71、初始化初始温度T,初始解状态X,每个T值的迭代次数L;S72、对N1,。
5、L做S73至S76;S73、产生新解X;S74、计算增量TSXSX,其中SX为评价函数;S75、若T0则接受X作为新的当前解,否则以概率EXPT/T接受X作为新的当前解;S76、如果满足终止条件则输出当前解作为最优解,结束程序,终止条件通常取为连续若干个新解都没有被接受时终止算法;S77、T逐渐减少,且T0,然后转S72。权利要求书CN104102834A1/6页3录音地点的识别方法技术领域0001本发明涉及一种录音地点的识别方法。背景技术0002如今,随着信息领域的数字技术向人类生活各个领域全面推进,音频数字化的存储方式几乎取代了传统的存储方式。同时计算机技术的飞速发展使得数字音频编辑越来越。
6、容易,篡改也越来越专业。0003根据有关部门调查统计基于数字音频的犯罪率正逐年递增。根据最高人民法院关于民事诉讼证据的若干规定第69条规定存有疑点的视听资料不能单独作为认定案件事实的依据。当数字音频文件作为法庭证据时,其原始性和完整性往往是需要注意的地方。然而,在不能确定录音时间和录音地点的前提下,即使音频文件具有原始性和完整性,也很难确定其有效性。0004音频资料作为技术含量成分比较高的证据类型,其原始性和完整性在目前的技术下能表现出来。然而在不同的时间不同的地点录制一段音频,它的原始性和完整性是满足的,但是音频的录制时间和地点是否和案件有关很难考证。0005现有的数字音频取证技术很难做到录。
7、音地点的识别,因此司法机关就不易对音频证据的有效性做出判断。发明内容0006本发明的目的是提供一种录音地点的识别方法,采用BP神经网络作为主要识别方法,效率高,解决现有的数字音频取证技术很难做到录音地点的识别的问题。0007为了解决以上问题,本发明通过以下技术方案实现0008一种录音地点的识别方法,0009S1、构建BP神经网络;0010S2、将各地的电网频率数据作KDA降维处理,以满足BP神经网络的输入要求;0011S3、将处理后的电网频率数据作为训练样本训练BP神经网络,并采用模拟退火算法进行权值更新;0012S4、提取录音中的电网频率数据,具体为将需要识别的录音先进行300HZ低通滤波,。
8、然后加重信号,接着进行窄带滤波,最后经过测频算法;0013S5、将录音中的电网频率数据作KDA降维处理;0014S6、将S5中处理好的数据输入到已经完成训练的BP神经网络进行识别;0015S7、用模拟退火算法搜索识别结果,并转换为具体地点。0016进一步地,电网频率数据为X1,X2,X3XN,通过一个映射F,将数据从N维空间映射到NNN维空间中;0017KDA降维算法公式如下KXI,XJFXITFXJ;0018其中,径向基核函数为KXI,XJEXP|XIXJ|2/22。说明书CN104102834A2/6页40019进一步地,所述步骤S4中,录音中电网频率提取是先经过300HZ低通滤波,然后对。
9、信号作加重处理,接着经过49HZ51HZ的窄带滤波,最后经过测频算法测频。0020进一步地,所述低通滤波采用的是巴特沃兹滤波器,所述窄带滤波采用的是椭圆滤波器。0021进一步地,所述步骤S7中,对N个地点,BP输出结果分别为SN,采用模拟退火算法,搜索其中的MAXSN,以确定录音的地点。0022进一步地,模拟退火算法搜索识别结果步骤如下0023S71、初始化初始温度T,初始解状态X,每个T值的迭代次数L;0024S72、对N1,L做S73至S76;0025S73、产生新解X;0026S74、计算增量TSXSX,其中SX为评价函数;0027S75、若T0则接受X作为新的当前解,否则以概率EXPT。
10、/T接受X作为新的当前解;0028S76、如果满足终止条件则输出当前解作为最优解,结束程序,终止条件通常取为连续若干个新解都没有被接受时终止算法;0029S77、T逐渐减少,且T0,然后转S72。0030本发明的有益效果是0031相比于现有技术,本发明的优点在于0032一、本发明基于BP神经网络,利用电网频率作为识别依据,解决了传统方法无法识别录音地点的难题;0033二、采用BP神经网络作为主要识别方法,效率高;0034三、采用KDA降维算法,使识别速度加快;0035四、采用模拟退火算法,能够快速搜索出识别结果。附图说明0036图1是实施例的说明示意图。0037图2是电力线电网频率采集的说明示。
11、意图。0038图3是音频信号电网频率提取的说明示意图。0039图4是电网频率信号部分未滤波的时域波形图。0040图5是电网频率信号已滤波频域图。0041图6是原始语音信号时域波形图。0042图7是语音信号滤波后频域图。0043图8是BP神经网络识别模型。具体实施方式0044下面结合说明书附图和具体的实施例,对本发明作详细描述。0045实施例0046实施例公开了一种录音地点识别方法,该方法是基于BP神经网络的一种识别方法。BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经说明书CN104102834A3/6页5网络模型之一。BP神经网络有较高的识别效率,但是其也有明显的。
12、弊端,为此本发明采用KDA降维算法,提高了识别速度,同时采用模拟退火算法搜索识别结果,能够迅速准确地识别出录音地点。0047结合图1,该种录音地点识别方法包含以下几个部分电网频率数据降维、音频中电网频率提取、BP神经网络识别模型的建立、搜索识别结果、将识别结果转换为具体地点。0048电网频率采集系统设计,由于国内没有可用的电网频率数据库,因此需要设计一个电力线上电网频率采集系统。另外,要实现基于电网频率的音频取证,还需要提取音频中的电网频率。0049电力线上和音频中电网频率采集系统设计,电网频率是直接从电力线上降压偏置然后ADC,最后经过49HZ51HZ窄带滤波后测频得到。如图2所示。0050。
13、由于音频中的电网频率信号较弱,因此先经过300HZ的低通滤波,然后加重低频信号,然后经过49HZ51HZ窄带滤波,最后测频得到。如图3所示0051ENF测频算法,用以下步骤得到最终得到电网频率。00521、接收到窄带滤波后N点的电压值XN;00532、对XN求其自相关函数即对XN求微分;0054XNXNXN1100553、分别对XN和XN加汉明窗得X1N和X1N以减小频谱泄露;0056X1NXNHANMINGN0057X1NXNHANMINGN200584、分别对XN和XN求N点DFT得XK和XK;0059XKDFTX1N0060XKDFTX1N300615、求XK和XK最大模值|XKMAX|。
14、和|XKMAX|;0062|XKMAX|XKOTHER|0063|XKMAX|XKOTHER|400646、根据KMAX求得采样因子FA;006500667、得测得频率FR00670068其中,PI31415926,FM采样频率。0069数据处理过程中的“维数灾难”0070实验中发现,采集到的数据是一个高维数组。一个小时的数据高达30000多维,直接将这些数据输入到BP神经网络,会使BP网络的训练时间相当长。因此需要对采集到的数据作降维处理。0071采用KDA降维算法,即基于核函数的非线性降维算法。具体如下说明书CN104102834A4/6页60072假设电网频率数据为X1,X2,X3XN,。
15、通过一个映射F,将数据从N维空间映射到NNN维空间中。0073首先将降维问题转换为两个向量内积的问题;0074KXI,XJFXITFXJ70075KXI,XJ是核函数,作用是接受两个低维向量,可以计算出经过某种变换后,在高维空间里的向量内积。0076径向基核函数为0077KXI,XJEXP|XIXJ|2/2280078通过以上算法可以对电网频率数据作降维处理。0079原始数据分析0080由图4可以看到,从时域上根本不能看到波形的变化,仅仅是波峰波谷处出现略微变形,但是从图4可以看出,电网频率频域波动比较明显。0081图6是原始语音波形,常规的音频取证手段很难识别出其录音地点。图5电网频率信号频。
16、域图已滤波,图7为语音信号滤波后经过测频的音频频域图,将图7和图5对比可以发现,利用图形的变化规律可以找出两个波形最相似的地方,从而识别出录音的地点。0082BP神经网络识别系统设计,BP神经网络一种按误差逆传播算法训练的多层前馈网络该网络,主要特点是信号前向传递,误差反向传递。在前向传递过程中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从何使BP神经网络预测输出不断逼近期望输出。0083基于BP神经网络录音地点识别0084实施例共选取了四个地点同一天中三个时间段的电网频率数。
17、据,分别是A地、B地、C地、D地9点10点、14点15点、19点20点的数据。将每个地点每个时间段的数据转换为500组30维电网频率数据。并提取四个地点3个时间段采集的语音中的特征电网频率,将之同样转换为500组30维语音中电网频率数据。并在语音中电网频率的第一维插入地点标示类,其中A地标示类为1,B地标示类为2,C地标示类为3,D地标示类为4。因此,将BP神经网络的期望输出向量定为00850086BP神经网络识别模型建立0087基于BP神经网络的语音地点识别算法建模包括BP神经网络构建、BP神经网络训练和BP神经网络识别。BP神经网络识别模型的建立如图8。0088模拟退火算法0089实施例采。
18、集了四个地点,而实际系统中有成千上万个地点。在BP神经网络的输出结果中找到匹配结果需要用到模拟退火算法。0090假设有N个地点,BP输出结果为SN,现采用模拟退火算法,搜索其中的MAXSN,以确定录音的地点。具体步骤如下说明书CN104102834A5/6页700911初始化初始温度T,初始解状态X,每个T值的迭代次数L;00922对N1,L做第3至第6步;00933产生新解X;00944计算增量TSXSX,其中SX为评价函数;00955若T0则接受X作为新的当前解,否则以概率EXPT/T接受X作为新的当前解;00966如果满足终止条件则输出当前解作为最优解,结束程序。终止条件通常取为连续若干。
19、个新解都没有被接受时终止算法;00977T逐渐减少,且T0,然后转第2步。0098BP神经网络录音地点识别算法设计0099根据输入输出数据特点确定BP神经网络的结构,由于电网中电网频率有30维,待识别的地点有四个,因此,BP神经网络的输入层有30个节点,隐含层有25个节点,输出层有4个节点。0100算法设计01011将三个时间段四个地点的电网频率数据合并为一个数组。作为训练数据;01022将同一地点三个时间段的音频中提取的电网频率数据合并为一个数组,作为测试数据;01033将输入数据作归一化处理;01044初始化BP神经网络;01055训练BP神经网络,设定训练次数为1000次;01066将三。
20、个时间段的测试数据归一化处理并输入到已训练好的BP神经网络,并根据地点标示类统计识别正确率;01077输出网络误差和BP神经网络识别率;01088用模拟退火算法搜索识别率里的最大值,确定识别结果。0109实验结果0110表19点10点的录音地点识别率01110112表1中,列为输入A、B、C、D地点音频电网频率数据,识别成A、B、C、D四个地点的百分比。表1中输入数据为一天中9点10点录音中提取的电网频率的数据,每个地点都说明书CN104102834A6/6页8有500组。0113表214点15点的录音地点识别率01140115表2中,列为输入A、B、C、D地点音频电网频率数据,识别成A、B、。
21、C、D四个地点的百分比。表2中输入数据为一天中14点15点录音中提取的电网频率的数据,每个地点都有500组。0116表319点20点的录音地点识别率01170118表3中,列为输入A、B、C、D地点音频电网频率数据,识别成A、B、C、D四个地点的百分比。表3中输入数据为一天中19点20点录音中提取的电网频率的数据,每个地点都有500组。0119从表1、2、3中可以看出,BP神经网络存在较低的识别误差,最大识别误差为94,即500个样本中有47个样本识别错误,但这并不影响得出识别录音地点的最终结论。因此基于BP网络的录音地点识别算法具有较高的准确性,能够准确识别出录音的地点。0120以上示意性地对本发明创造及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明创造的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本专利的保护范围。说明书CN104102834A1/4页9图1图2图3说明书附图CN104102834A2/4页10图4图5说明书附图CN104102834A103/4页11图6图7说明书附图CN104102834A114/4页12图8说明书附图CN104102834A12。