《一种基于稀疏度量的分类方法.pdf》由会员分享,可在线阅读,更多相关《一种基于稀疏度量的分类方法.pdf(10页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103077318 A(43)申请公布日 2013.05.01CN103077318A*CN103077318A*(21)申请号 201310017610.8(22)申请日 2013.01.17G06F 19/00(2006.01)(71)申请人电子科技大学地址 611731 四川省成都市高新区(西区)西源大道2006号(72)发明人徐鹏 李沛洋 张锐 田春阳郭兰锦 尧德中(74)专利代理机构成都宏顺专利代理事务所(普通合伙) 51227代理人周永宏(54) 发明名称一种基于稀疏度量的分类方法(57) 摘要本发明公开了一种基于稀疏度量的分类方法,具体为:计算类间离散度。
2、矩阵和类内离散度矩阵,对得到的矩阵进行分解,将Fisher判别准则转化为L1模结构,估计使得目标函数取得最大值的投影向量。针对现有的基于L2模测度函数的LDA会对Outliers等噪声产生不利的放大,本发明的方法在构造判别分析时采用了基于L1模的测度函数,能够克服现有基于L2模的线性判别分析受到Outliers以及噪声孤立点影响的问题,获得稳健的分类识别效果,在一定程度上提高BCI系统的稳定性。(51)Int.Cl.权利要求书1页 说明书6页 附图2页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书6页 附图2页(10)申请公布号 CN 103077318 ACN。
3、 103077318 A1/1页21.一种基于稀疏度量的分类方法,具体包括如下步骤:S1.根据脑电信号训练样本分别计算类间离散度矩阵SB和类内离散度矩阵SW;S2.根据步骤S1得到的类间离散度矩阵SB和类内离散度矩阵SW构造出相应的B和其中,B和分别满足S3.将Fisher判别准则转化为L1模结构,即有:将所述L1模结构映射到对数空间转化为如下目标函数:其中,w为投影向量,估计使得目标函数取得最大值的投影向量w。2.根据权利要求1所述的基于稀疏度量的分类方法,其特征在于,还包括步骤S4.将测试样本投影到向量w张开的空间进行分类。3.根据权利要求1或2所述的基于稀疏度量的分类方法,其特征在于,步。
4、骤S2具体采用奇异值分解构造B和4.根据权利要求1或2所述的基于稀疏度量的分类方法,其特征在于,步骤S3中估计使得目标函数取得最大值的投影向量w的具体过程如下:S31.对目标函数J*(w)两边同时求导计算出相应的梯度:其中,B(:,i),分别表示矩阵B和的第i列向量和第j列向量,m表示构成矩阵B和的列向量个数;S32.利用梯度下降法对目标向量w进行估计。5.根据权利要求4所述的基于稀疏度量的分类方法,其特征在于,步骤S32利用梯度下降法对目标向量w进行估计的具体过程如下:更新过程表示为:w(t+1)=w(t)-w(t)Tdw其中,t表示迭代次数,w(t)为一m1的向量,表示第t次迭代得到的估计。
5、结果,w(t+1)表示第t+1次得到的估计结果,初始迭代向量w(0)Rm设置为一任意的非0向量;为迭代步距,选择使得J*(w(t+1)达到最大的一个值作为本次迭代的;当满足|J*(w(t+1)-J*(w(t)|时,迭代停止,为预先设定的阈值。权 利 要 求 书CN 103077318 A1/6页3一种基于稀疏度量的分类方法技术领域0001 本发明属于生物医学信息技术领域,具体涉及脑-机接口领域中的模式分类方法。背景技术0002 脑-机接口(Brain Computer Interface,BCI)是利用计算机或其他外部电子设备之间实现人脑与外界进行直接交流和控制的通道(Wolpaw JR,Bi。
6、rbaumer N,McFarland DJ,Pfurtscheller G, Vaughan TM(2002)Brain-computer interfaces for communication and control.Clin Neurophysiol113,767-791)。BCI研究涉及众多学科,例如:神经科学、信号检测、信号处理、模式识别、控制理论等,这些学科的交叉发展推动了BCI研究的推进。BCI的基础理论与临床应用研究,已被纳入脑科学和神经工程学的范畴,也被国际上的很多权威机构认为是21世纪脑与神经科学研究中的最前沿与热点之一。0003 一个BCI系统包括信号采集、数据处理以及。
7、外设与接口三个部分。在数据处理中,EEG信号的模式分类是BCI系统能否翻译出大脑信息的关键。用于脑机接口的模式分类方法很多,其中,线性判别分析方法(Linear Discriminant Analysis,LDA)由于简单的结构原理以及较低的计算复杂度而在BCI模式识别中得到了广泛的应用。0004 线性判别分析的基本思想是将高维空间中的样本投影到一个低维特征空间并使得投影后的样本在新的空间中具有最大的类间离散度和最小的类内离散度,满足条件的特征空间即为使(1)式达到最大的特征向量w所张成的子空间:0005 0006 0007 0008 0009 0010 其中,m为总体样本个数,c为总的类别个。
8、数,ni表示第i类样本的样本个数,且有xk表示训练集中的第k个样本,classi表示样本的类别为i,i为第i类样本的样本均值,为总体样本均值;w为一m1的列向量,wT为其转置,而SB和Sw分别为类间离散度矩阵和类内离散度矩阵,且两者均为mm的矩阵。0011 通过一定的线性变化并引入拉格朗日乘子,则式(1)可以表示为:0012 L(w,)=wTSBw-(wTSWw-1) (6)说 明 书CN 103077318 A2/6页40013 式(6)两端同时对w求偏导可得:0014 0015 令其为0则有:0016 SBw=SWw (8)0017 式(8)的广义特征向量w即为通过LDA求出的投影向量。0。
9、018 由于LDA的本质是基于L2模范数来定义的,然而在脑电研究中,从脑电放大器采集到的脑电信号样本维度常常远大于样本个数,并且具有很强的随机性,特别是在脑机接口领域,这类问题表现得更为突出。基于L2模方法产生的解虽然具有很好的平滑性,但不具备稀疏性,并且容易受到实验过程中由于电极松动、眨眼以及操作不当所产生的异常值(Outliers)以及孤立噪声点的影响,甚至有时使得信号矩阵变得奇异,从而可能产生对投影w的错误估计,最终影响分类效果;并且这些干扰会增加脑电信号的阅读难度并阻碍脑电信号的后续分析研究。发明内容0019 本发明的目的是为了解决现有的基于L2模的线性判别分析方法存在的上述问题,提出。
10、一种基于稀疏度量的分类方法0020 本发明采用的技术方案是:一种基于稀疏度量的分类方法,具体包括如下步骤:0021 S1.根据脑电信号训练样本分别计算类间离散度矩阵SB和类内离散度矩阵SW;0022 S2.根据步骤S1得到的类间离散度矩阵SB和类内离散度矩阵SW构造出相应的B和其中,B和分别满足T为矩阵的转置运算;0023 S3.将Fisher判别准则转化为L1模结构,即有:将该结构映射到对数空间转化为如下目标函数:其中,w为投影向量,估计使得目标函数取得最大值的投影向量w。0024 进一步的,上述方法还包括步骤S4.将测试样本投影到向量w张开的空间进行分类。0025 本发明的有益效果是:现有。
11、的基于L2模测度函数的LDA会对Outliers等噪声产生不利的放大,本发明的方法在构造判别分析时采用了基于L1模的测度函数,能够克服现有基于L2模的线性判别分析受到Outliers以及噪声孤立点影响的问题,获得稳健的分类识别效果,在一定程度上提高BCI系统的稳定性;实验证明本发明提出的方法能够在较短的时间收敛,从而满足脑机接口在线系统对实时性的要求。附图说明0026 图1本发明方法的流程示意图。0027 图2本发明实施例中高斯数据仿真示意图。0028 图3本发明实施例中大肠癌基因识别效果对比图。说 明 书CN 103077318 A3/6页5具体实施方式0029 下面结合附图和具体实施例对本。
12、发明做进一步的说明。0030 由于SB、SW均为实对称矩阵,本质上由两个矩阵分别于自身的转置矩阵的乘积构成,所以式(1)亦可表示为:0031 0032 SB、SW通过一定的矩阵分解定理可以找到相应的B和因此本发明的方法可以描述如下:0033 S1.根据脑电信号训练样本分别计算类间离散度矩阵SB和类内离散度矩阵SW;0034 为了构造相应的类间离散度矩阵和类内离散度矩阵,可以事先在训练样本中分别计算出每一类的样本均值i和总体样本均值,按照公式(2)和公式(3)分别计算出类间离散度矩阵SB以及类内离散度矩阵SW。0035 S2.根据步骤S1得到的类间离散度矩阵SB和类内离散度矩阵SW构造出相应的B。
13、和其中,B和分别满足T为矩阵的转置运算;0036 这里可以采用奇异值分解构造相应的B和公式如下:0037 0038 0039 其中,由于SB和SW均为实对称矩阵,因此进行奇异值分解以后其左奇异矩阵U和右奇异矩阵V仅存在一个转置关系,其大小为mm;B=diag(B1,B2,Bm)和W=diag(W1,W2,Wm)分别为SB和SW的奇异值构成的对角矩阵,且有B1B2Bm=0以及W1W2Wm=0;均为mm的矩阵。0040 S3.将Fisher判别准则转化为L1模结构,即有:0041 将该结构映射到对数空间转化为如下目标函数:其中,w为投影向量,估计使得目标函数取得最大值的投影向量w。0042 上述过。
14、程为训练投影向量w的过程,作为一种优选方案,这里还包括测试过程步骤S4.将测试样本投影到向量w张开的空间进行分类,具体可以采用最近邻方式估计测试样本的模式。0043 这里在步骤S3中估计使得目标函数取得最大值的投影向量w的具体过程如下:0044 S31.对目标函数J*(w)两边同时求导计算出相应的梯度:0045 说 明 书CN 103077318 A4/6页60046 其中,0047 0048 B(:,i),分别表示矩阵B和的第i列向量和第j列向量,m表示构成矩阵B和的列向量个数;0049 S32.利用梯度下降法对目标向量w进行估计,估计的具体过程如下:0050 更新过程表示为:0051 w(。
15、t+1)=w(t)-w(t)Tdw0052 其中,t=0,1,n表示迭代次数,w(t)为一m1的向量,表示第t次迭代得到的估计结果w(t+1)表示第t+1次得到的估计结果,其为w(t)的线性组合,初始迭代向量w(0)Rm可以设置为一任意的非0向量;为迭代步距,在这里可以选择使得J*(w(t+1)达到最大的一个值作为本次迭代的,从而保证算法的快速收敛性;当满足|J*(w(t+1)-J*(w(t)|时,迭代停止,为预先设定的阈值。在本实施例中,1e-005。0053 为了验证本方案的可行性和效果,将本发明的方法(L1_LDA)与传统的LDA对比,做了三组比较实验。第一组采用两类不同均值和标准差的高。
16、斯数据并引入outlier作为仿真实验,第二组采用国际脑机接口比赛的数据,验证本方案在脑机接口中的效果;第三组采用普林斯顿大学的大肠癌组织数据,验证本方案的扩展可能性。0054 第一组实验:0055 数据A来源于均值向量为3;3,标准差向量为0.5;0.5的高斯分布矩阵;数据B的均值向量具体如表1所示:0056 表10057 0058 标准差向量为0.5;0.5的高斯分布矩阵(数据B在对角线方向上逐渐靠近数据A),Outlier数据来源于均值向量为7.25;7.25,标准差向量为0.5;0.5的高斯分布矩阵,Outliers的个数为10,实验中的数据分布及投影如图2所示,其中,(a)表示引入O。
17、utliers以后的数据散点图,*以及o分别表示来自不同样本集的数据,可以看出引入Outliers以后,一部分数据发生了偏移,成为了异常值;(b)表示传统LDA方法对测试集样本的分类投影,可以看出因为受到Outliers的影响,一部分数据通过LDA投影向量映射到了离聚类中心较远的位置,增大了误分的概率;(c)表示经过L1模约束的LDA方法对测试样本的分类投影,可以看出由于L1模对Outliers的抑制作用使得两类数据经过投影向量映射后集中分布在了两类数据的聚类中心附近,提高了分类效果的稳定性。说 明 书CN 103077318 A5/6页70059 分类准确率如表2所示,其中粗体表示效果较好,。
18、“*”表示有显著性差异(p0.05)。0060 表20061 0062 0063 第二组实验:0064 国际脑机接口第三次比赛实验数据A(被试编号aa al av aw ay);具体如表3所示:0065 表30066 0067 第三组实验:0068 实验说明:数据来源于普林斯顿大学的直肠癌组织数据,其中包含了62个不同被试的大肠组织,每个组织有2000个基因表达,其中有40个组织表现出阳性,22个组织表现出阴性。采用5倍交叉验证,实验50次的平均分类准确率如图3所示。0069 以上实验结果均证明本发明的方法是可行,并且在某些情况下,本发明的方法相比传统LDA效果尤为明显。总体来说,无论是仿真实。
19、验还是真实的实验数据,其结果验证了本发明的方法的有效性和可行性,对于提高脑电研究系统的稳定性,提取更加有效的大脑说 明 书CN 103077318 A6/6页8功能信息具有重大的理论和实践意义。本发明的方法不仅在脑机接口领域有较好的效果,通过实验证明,对于其它领域的模式识别也有较好的效果。0070 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。说 明 书CN 103077318 A1/2页9图1图2说 明 书 附 图CN 103077318 A2/2页10图3说 明 书 附 图CN 103077318 A10。