一种代价敏感支持向量机机车车轮检测系统及方法.pdf

上传人:000****221 文档编号:5994546 上传时间:2019-04-02 格式:PDF 页数:18 大小:1.09MB
返回 下载 相关 举报
摘要
申请专利号:

CN201610880518.8

申请日:

2016.10.09

公开号:

CN106482967A

公开日:

2017.03.08

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G01M 17/013申请日:20161009|||公开

IPC分类号:

G01M17/013; G06K9/62

主分类号:

G01M17/013

申请人:

湖南工业大学

发明人:

何静; 刘林凡; 张昌凡; 谭海湖; 赵凯辉; 孙健; 豆兵兵; 刘光伟

地址:

412000 湖南省株洲市天元区泰山西路88号

优先权:

专利代理机构:

广州粤高专利商标代理有限公司 44102

代理人:

任重;冯振宁

PDF下载: PDF下载
内容摘要

本发明公开了一种代价敏感支持向量机机车车轮状态检测系统及方法,所述系统包括数据预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判别模块和车轮状态输出模块;所述检测方法包括共八个步骤,所述参数寻优步骤采用自适应变异粒子群算法,该算法是一种变异粒子群算法,具有很强的鲁棒性和全局搜索特性等优点,拓展了在迭代中不断缩小的空间,在更大空间中开展搜索,同时保持了种群多样性,提高算法寻找到最优值的可能性。

权利要求书

1.一种代价敏感支持向量机机车车轮状态检测系统,其特征在于:所述系统包括数据
预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类
模块、判别模块和车轮状态输出模块;所述数据预处理模块输出端与训练模块输入端连接;
所述代价敏感支持向量机训练模块输出端与参数寻优模块输入端相连接,所述参数寻优模
块输出端与最优代价敏感支持向量机分类模块输出端连接,所述最优代价敏感支持向量机
分类模块输出端与判别模块输入端连接,所述判别模块输出端与参数寻优模块输入端和车
轮状态输出模块输入端连接。
2.根据权利要求1所述的代价敏感支持向量机机车车轮状态检测系统,其特征在于,所
述预处理模块将机车车轮状态分为安全区和故障区两种类型;选取数据源,对数据源进行
特征提取,提取到的特征变量作为样本数据集,样本数据集分为训练集和测试集,对训练集
样本和测试集样本进行归一化处理。
3.根据权利要求1所述的代价敏感支持向量机机车车轮状态检测系统,其特征在于:所
述参数寻优模块采用自适应变异粒子群算法,寻找代价敏感支持向量的两个惩罚因子和核
函数。
4.根据权利要求1所述的代价敏感支持向量机机车车轮状态检测系统,其特征在于:所
述代价敏感支持向量机的训练模块对训练集样本进行处理;所述代价敏感支持向量机分类
模块存贮代价敏感支持向量机对样本进行训练后得到的支持向量库;所述判别模块对代价
敏感支持向量机的训练器性能进行评估,若达到合格的分类准确率,则输出到车轮状态输
出模块。
5.一种权利要求1~4任意一条所述的代价敏感支持向量机机车车轮状态检测系统的
检测方法,其特征在于,包括以下步骤:
S1.将机车车轮状态分为安全区和故障区两种类型;
S2.选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数据集,将
实时样本数据集分为训练集和测试集两个子集;
S3.所述数据预处理模块对实时样本数据集预处理,并对训练集和测试集样本进行归
一化处理,使其范围仅在0~1之间的数值,然后将归一化后的训练集作为代价敏感支持向
量机训练模块的输入向量进行处理;
S4.所述训练模块对归一化后的训练集进行处理,经过代价敏感支持向量机的训练,将
会得到一组支持向量,然后存入数据库中;
S5.所述参数寻优模块对代价敏感支持向量机的核参数和两个惩罚因子运用自适应变
异粒子群算法进行全局寻优;得到最优代价敏感支持向量机;
S6.所述分类模块对测试集中的实时样本数据进行分类;并存贮代价敏感支持向量机
对实时样本数据集进行训练后得到的支持向量库。
S7.数据准确率判别,将测试集内的特征变量输入至最优代价敏感支持向量机模型内
进行测试,最优代价敏感支持向量机模型输出识别结果,识别结果为安全或故障状态;将输
出的识别结果与机车实际车轮状态进行比较,计算识别的准确率;
S8.车轮状态输出;若识别的准确率满足要求则输出车轮状态,否则重新进行。
6.根据权利要求5所述机车车轮检测方法,其特征在于,所述归一化算法过程为:

其中x和x′分别为归一化前和后的值。
7.根据权利要求5所述机车车轮检测方法,其特征在于,所述步骤S6采用高斯径向基核
函数、线性核函数、多项式核函数或两层感知机核函数对样本数据进行分类。
8.根据权利要求5所述机车车轮检测方法,其特征在于,所述步骤S5参数寻优采用自适
应变异粒子群算法,包括以下步骤:
S81.初始化自适应变异粒子群参数;
S82.适应度计算;
S83.寻找个体极值和群体极值;
S84.粒子速度更新和位置更新;
S85.粒子每次更新后,用一定概率重新初始化粒子;
S86.重新进行粒子适应度计算;
S87.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最为
当前最好的位置,完成个体极值和群体极值的更新;
S88.终止条件检查,如果不满足终止标准,则转到步骤S84,否则转至下一步;所述终止
标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;
S89.输出终止迭代次数时粒子中的两个惩罚因子和核函数。
9.根据权利要求8所述机车车轮检测方法,其特征在于,所述更新公式为:

若则
v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数;若r3>0.5,则k=-1;
若r3≤0.5,则k=1。

说明书

一种代价敏感支持向量机机车车轮检测系统及方法

技术领域

本发明属于测量工程技术领域,更具体地,涉及一种代价敏感支持向量机模型机
车车轮检测系统及方法。

背景技术

支持向量机是在统计学理论发展起来的一种实用方法,是专门研究小样本情况下
机器学习规律的理论,基于结构风险最小化原则,在模式识别和机器学习领域占有非常重
要地位。由于SVM能有效克服其他机器学习方法的过学习、欠学习、泛化能力不高和局部极
小值等缺点,如今SVM已经广泛应用于状态识别、故障检测等领域。现有技术提出了基于支
持向量机的高速列车车轮空转预测方法,但是该方法手动修改支持向量机分类阈值,实验
量较大;针对数据不平衡的模糊支持向量机,泛化性较差。

为了保障重载机车安全运行,对车轮状态进行检测非常有必要,机车车轮状态检
测系统要求轨面发生变化时能够准确实时检测机车车轮状态,当轨面发生较大变化时,有
可能产生机车打滑或空转的现象,若没有及时检测并处理会造成较大安全问题。

而实际应用中,车轮正常运行的样本往往远多于故障状态的样本,类别不平衡的
数据集往往存在着误分类和代价不等的问题,代价敏感支持向量机作为一种新兴的学习机
器,虽然能够对数据样本进行分类输出,但是仍存在有待完善的地方,其参数选取便是亟待
解决的问题之一,惩罚因子、核函数以及核函数参数取值的好坏直接影响分类器的识别精
度和效率。

发明内容

为了克服传统的代价敏感支持向量机存在的数据样本误分类及代价不等的问题,
进而考虑到自适应变异粒子群算法是一种基于群体的智能寻优算法,具有很强鲁棒性,种
群多样性和全局搜索特性等优点。根据重载机车车轮状态采集数据具有小样本的特点,且
机车粘着系数和蠕滑速度的关系呈现高度非线性的特点,可利用代价敏感支持向量机来对
车轮状态建立分类模型。由此,本发明提出了自适应变异粒子群算法优化参数的代价敏感
支持向量机对重载机车车轮状态进行分类的方法。针对重载机车在实际运行中正常状态远
多于故障状态而形成的数据不均衡问题,采用代价敏感支持向量机建立机车车轮状态分类
模型,并采用自适应变异粒子群算法优化相关参数,实现重载机车车轮状态分类检测。

具体的,本发明提供了一种利用自适应变异粒子群算法搜索出的最优代价敏感支
持向量机模型,避免了参数选择的盲目性和不准确性,同时提高了检测分类率,代价敏感支
持向量机对类别不均衡样本二分类具有卓越的分类性能,。

本发明的技术方案如下:

一种代价敏感支持向量机机车车轮状态检测系统,所述系统包括数据预处理模
块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判
别模块和车轮状态输出模块;

所述数据预处理模块输出端与训练模块输入端连接,所述代价敏感支持向量机训
练模块输出端与参数寻优模块输入端相连接,所述参数寻优模块输出端与最优代价敏感支
持向量机分类模块输出端连接,所述最优代价敏感支持向量机分类模块输出端与判别模块
输入端连接,所述判别模块输出端与参数寻优模块输入端和车轮状态输出模块输入端连
接。

进一步地,所述预处理模块将机车车轮状态分为安全区和故障区两种类型;选取
数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数据集,实时样本数据集
分为训练集和测试集,对训练集样本和测试集样本进行归一化处理。

进一步地,所述参数寻优模块采用自适应变异粒子群算法,寻找代价敏感支持向
量的两个惩罚因子和核函数。

更进一步地,自适应变异粒子群算法是求解此类问题的一种有效方法,其程序实
现异常简单,需要调整的参数极少,无需任何梯度信息,在函数优化、组合优化以及许多工
程领域均得到了广泛的应用。

粒子群算法是一种模拟鸟群运动规律的启发式算法,其更新公式为:



式中,第i个粒子的位置可用矢量表示为xi=(xi1,xi2,…,xid,…,xiD),xid∈
[xmin,d,xmax,d],其中d=1,2,…D,D为解空间的维数,xmin,d和xmax,x分别是第d维空间的限制
边界;粒子的速度可表示为vi=(vi1,vi2,…,vid,…,viD),其速度最大限制为vi=(vmax,1,
vmax,2,…,vmax,d,…,vmax,D)。第i个粒子的最优空间位置记为局部最优pi=(pi1,pi2,…,
pid,…,piD),同样种群中位置最优的粒子记为全局最优pg;ω为惯性权重,k为当前迭代次
数;c1和c2称加速度系数,r1和r2为分布于[0,1]之间的随机数。

粒子群算法收敛快,具有很强的通用性,但同时存在着容易早熟收敛、搜索精度较
低、后期迭代效率不高等缺点,为了提高粒子群算法的性能,引入一种自适应变异操作,以
求解决粒子群算法早熟收敛以及搜索能力随代数增加而逐渐下降的特点,其算法描述为:


若则

其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>
0.5,则k=-1,若r3≤0.5,则k=1。

在不改变等式(1)和(2)的性质下,为了描述方便将其简化为:

vk+1=k0vk+c1r1(p1-xk)+c2r2(p2-xk) (5)

xk+1=xk+vk+1 (6)

选取

采取如下的简化措施:



那么方程(5)和(6)可以简化为:

vk+1=k0vk+k1(p-xk) (10)

xk+1=xk+vk+1 (11)

方程(10)和(11)可以写成yk+1=Myk+Np形式其中


自适应变异粒子群寻优过程中,将会收敛到如下式:

yi=[xi vi]T (13)

其中xi=p,vi=0。

粒子的寻参时间取决于矩阵M的特征根λ1,λ2,矩阵M的特征方程如下:

λ2-(k0-k1+1)λ+k0=0 (14)

式(13)存在的充分必要条件是矩阵M的特征根λ1,λ2都小于1,则可以通过求解式
(14)得到如下条件:

k0<1,k1>0,2k0-k1+2>0 (15)

由表示在[0,1]区间内均匀分布的随机数,可知本发明提出的自适应变
异粒子群算法满足(15)的约束条件。

进一步地,所述代价敏感支持向量机的训练模块对训练集样本进行处理;所述代
价敏感支持向量机分类模块存贮代价敏感支持向量机对样本进行训练后得到的支持向量
库;所述判别模块对代价敏感支持向量机的训练器性能进行评估,若达到合格的分类准确
率,则输出到车轮状态输出模块。

更进一步地,一种所述的参数优化的代价敏感支持向量机机车车轮状态检测系统
的检测方法,包括以下步骤:

第一步,将机车车轮状态分为安全区和故障区两种类型;

第二步,选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数
据集,将实时样本数据集分为训练集和测试集两个子集;

第三步,数据预处理模块对实时样本数据集预处理,并对训练集和测试集样本进
行归一化处理,使其范围仅在0~1之间的数值,然后将归一化后的训练集作为代价敏感支
持向量机训练模块的输入向量进行处理;

第四步,训练模块对归一化后的训练集进行处理,经过代价敏感支持向量机的训
练,将会得到一组支持向量,然后存入数据库中;

第五步,参数寻优模块对代价敏感支持向量机的核参数和两个惩罚因子运用自适
应变异粒子群算法进行全局寻优;得到最优代价敏感支持向量机;

第六步,分类模块对测试集中的实时样本数据进行分类;并存贮代价敏感支持向
量机对实时样本数据集进行训练后得到的支持向量库;

第七步,数据准确率判别,将测试集内的特征变量输入至最优代价敏感支持向量
机模型内进行测试,最优代价敏感支持向量机模型输出识别结果,识别结果为安全或故障
状态;将输出的识别结果与机车实际车轮状态进行比较,计算识别的准确率;

第八步,车轮状态输出;若识别的准确率满足要求则输出车轮状态,否则重新进
行。

进一步地,由于采集到的重载机车数据样本中各变量差异较大,在建立代价敏感
支持向量机分类模型前对训练集和预测集样本归一化到[0,1]区间,所述归一化算法过程
为:


其中x和x′分别为归一化前和后的值。

进一步地,第六步中采用高斯径向基核函数、线性核函数、多项式核函数或两层感
知机核函数对样本数据进行分类。

更进一步地,第五步中参数寻优包括以下步骤:

1.初始化自适应变异粒子群参数;

2.适应度计算;

3.寻找个体极值和群体极值;

4.粒子速度更新和位置更新;

5.粒子每次更新后,用一定概率重新初始化粒子;

6.重新进行粒子适应度计算;

7.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最
为当前最好的位置,完成个体极值和群体极值的更新;

8.终止条件检查,如果不满足终止标准,则转到步骤4,否则转至下一步;所述终止
标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;

9.输出终止迭代次数时粒子中的两个惩罚因子和核函数。

更进一步地,利用自适应变异粒子群算法寻找最优代价敏感支持向量机参数,经
过训练集和测试集预处理和适应度评估操作,粒子速度更新后用自适应变异粒子群算法重
新初始化粒子,判断是否满足终止精度或当前迭代次数是否等于最大迭代次数,若满足则
输出最优误分类代价参数C1,C2和最优核参数宽度值σ;否则重新进行自适应变异粒子群算
法;

更进一步地,自适应变异粒子群算法更新公式为:


若则

其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>
0.5,则k=-1,若r3≤0.5,则k=1。

附图说明

图1为代价敏感支持向量机机车车轮状态检测系统示意图;

图2为代价敏感支持向量机机车车轮状态检测方法步骤示意图;

图3为自适应变异粒子群算法步骤示意图;

图4不均衡数据分类示意图;

图5为自适应变异粒子群算法SVM分类可视化图;

图6为测试集的分类结果图;

图7为自适应变异粒子群算法寻参的适应度曲线图;

图8为自适应变异粒子群算法CS-SVM分类可视化图;

图9为测试集分类结果图;

图10为遗传算法寻找最佳参数的适应度曲线图;

图11为遗传算法CS-SVM分类可视化图;

图12为测试集分类结果图;

图13为SVM和CS-SVM的ROC曲线对比图。

具体实施方式

下面结合具体实施方式对本实用新型作进一步的说明。其中,附图仅用于示例性
说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本实
用新型的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领
域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

实施例1

如图1所示,一种代价敏感支持向量机机车车轮状态检测系统,包括数据预处理模
块1、代价敏感支持向量机训练模块2、参数寻优模块3、最优代价敏感支持向量机分类模块
4、判别模块5和车轮状态输出模块6;

数据预处理模块1输出端与训练模块2输入端连接,所述代价敏感支持向量机训练
模块2输出端与参数寻优模块3输入端相连接,所述参数寻优3模块输出端与最优代价敏感
支持向量机分类模块4输出端连接,所述最优代价敏感支持向量机分类模块4输出端与判别
模块5输入端连接,所述判别模块5输出端与参数寻优3模块输入端和车轮状态输出模块6输
入端连接。

如图2所示,一种代价敏感支持向量机机车车轮状态检测系统的检测方法,包括以
下步骤:

第一步,将机车车轮状态分为安全区和故障区两种类型;

第二步,选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数
据集,将实时样本数据集分为训练集和测试集两个子集;

第三步,数据预处理模块对实时样本数据集预处理,并对训练集和测试集样本进
行归一化处理,使其范围仅在0~1之间的数值,然后将归一化后的训练集作为代价敏感支
持向量机训练模块的输入向量进行处理;

第四步,训练模块对归一化后的训练集进行处理,经过代价敏感支持向量机的训
练,将会得到一组支持向量,然后存入数据库中;

第五步,参数寻优模块对代价敏感支持向量机的核参数和两个惩罚因子运用自适
应变异粒子群算法进行全局寻优;得到最优代价敏感支持向量机;

第六步,分类模块对测试集中的实时样本数据进行分类;并存贮代价敏感支持向
量机对实时样本数据集进行训练后得到的支持向量库;

第七步,数据准确率判别,将测试集内的特征变量输入至最优代价敏感支持向量
机模型内进行测试,最优代价敏感支持向量机模型输出识别结果,识别结果为安全或故障
状态;将输出的识别结果与机车实际车轮状态进行比较,计算识别的准确率;

第八步,车轮状态输出;若识别的准确率满足要求则输出车轮状态,否则重新进
行。

实施例2

数据不均衡是指参与分类的两个类别样本数量差异很大,会引起分类超平面偏斜
问题。

图4中圆形的点代表正类,方形的点代表负类。H、H1和H2是根据给定样本集计算出
来的分类面,由于负类的样本很少,所以有部分本来是负类的样本点没有提供,如图4中H4
上两个的方形点,若提供了这两个点,则对应的分类面应该是H1、H3和H4,显然和之前的结
果差别很大。现在由于偏斜的现象存在,使得数量多的正类可以把分类面向负类的方向
“推”,因而影响了结果的准确性。用标准支持向量机解决不均衡数据样本分类问题时,易导
致划分超分类平面发生偏移,因此引入具有惩罚参数不同的代价敏感支持向量机,对样本
集较多的一类采用较小的惩罚参数,而对样本集较少的另一类采用较大的惩罚参数。

将粘着系数μ和蠕滑速度vs作为代价敏感支持向量机模型的输入量xi=[μ,vs]i,
机车车轮状态标签作为模型的输出量yi∈{+1,-1},因此训练样本集为代价敏
感支持向量机通过非线性映射函数将输入空间的样本x映射到高维特征空间H中,并在
高维特征空间H中利用结构风险最小化原则建立分类函数


式中,ω为权值向量,ω∈H;b为偏置,b∈R;y′为预测值。

对于代价敏感支持向量机,不同类样本误分时被赋予不同的误分类代价C1,C2,利
用结构风险最小化原则,代价敏感支持向量机优化问题为:


s.t.yi(wTφ(xi)+b)≥1-ξi i=1,2,…,n

ξi≥0 i=1,2,…,n

Ci≥0 i=1,2

式中,C1,C2是误分类代价参数,w用于表征模型复杂度,为误差yi∈{+1,-1},
I+={i:yi=+1},I-={i:yi=-1}。

求解式(2)时,通过引入非负的lagrange乘子构造lagrange函数,则问题转化为求
lagrange式的鞍点,分别对式中各变量求偏导数并令其为零,利用对偶原理,转化为求解对
偶问题。


s.t.0≤αi≤C1 i∈I+

0≤αi≤C2 i∈I-


式中,为lagrange乘子,C1,C2是误分类代价参数,K(xi,xj)为核函数,yi∈{+
1,-1}I+={i:yi=+1},I-={i:yi=-1}。

由此可以通过选取适当参数C1,C2和核函数K(xi,xj),求解此对偶问题。

在本发明中,代价敏感支持向量机分类模型需要确定的参数为误分类代价参数
C1,C2和核参数δ,其选取原则和取值直接对模型分类精确程度有很大的影响。为了使代价敏
感支持向量机有最优的性能,本发明采用自适应变异粒子群算法对代价敏感支持向量机模
型的误分代价参数C1,C2和核参数δ进行寻优,避免人为选择参数的盲目性。自适应变异粒子
群优化算法是求解此类问题的一种有效方法,其程序实现异常简单,需要调整的参数极少,
无需任何梯度信息,在函数优化、组合优化以及许多工程领域均得到了广泛的应用。粒子群
算法是一种模拟鸟群运动规律的启发式算法,其更新公式为:



式中,第i个粒子的位置可用矢量表示为xi=(xi1,xi2,…,xid,…,xiD),xid∈
[xmin,d,xmax,d],其中d=1,2,…D,D为解空间的维数,xmin,d和xmax,d分别是第d维空间的限制边
界;粒子的速度可表示为vi=(vi1,vi2,…,vid,…,viD),其速度最大限制为vi=(vmax,1,
vmax,2,…,vmax,d,…,vmax,D)。第i个粒子的最优空间位置记为局部最优pi=(pi1,pi2,…,
pid,…,piD),同样种群中位置最优的粒子记为全局最优pg;ω为惯性权重,k为当前迭代次
数;c1和c2称加速度系数,r1和r2为分布于[0,1]之间的随机数。

粒子群算法收敛快,具有很强的通用性,但同时存在着容易早熟收敛、搜索精度较
低、后期迭代效率不高等缺点。为了提高PSO算法的性能,引入一种变异操作,以求解决粒子
群算法早熟收敛以及搜索能力随代数增加而逐渐下降的特点,其算法描述为:


若则

其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>
0.5,则k=-1,若r3≤0.5,则k=1。

在不改变等式(4)和(5)的性质下,为了描述方便将其简化为:

vk+1=k0vk+c1r1(p1-xk)+c2r2(p2-xk) (8)

xk+1=xk+vk+1 (9)

选取

采取以下措施将方程简化:



那么方程(8)和(9))可以简化为:

vk+1=k0vk+k1(p-xk) (13)

xk+1=xk+vk+1 (14)

方程(13)和(14)可以写成yk+1=Myk+Np形式其中


自适应变异粒子群寻优过程中,将会收敛到如下式:

yi=[xi vi]T (16)

其中xi=p,vi=0

粒子的寻参时间取决于矩阵M的特征根λ1,λ2,矩阵M的特征方程如下:

λ2-(k0-k1+1)λ+k0=0 (17)

式(16)存在的充分必要条件是矩阵M的特征根λ1,λ2都小于1,则可以通过求解式
(17)得到如下条件:

k0<1,k1>0,2k0-k1+2>0 (18)

由表示在[0,1]区间内均匀分布的随机数,可知本文提出的自适应变异
粒子群算法满足(18)的约束条件。

终上所述,采用代价敏感支持向量机分类方法与自适应变异粒子群算法相结合的
重载机车车轮状态检测步骤如下:

(1)数据样本归一化。由于采集到的重载机车数据样本中各变量差异较大,在建立
CS-SVM分类模型前对训练集和预测集样本归一化到[0,1]区间,计算公式为


式中x、x′分别为归一化前、后的值。

(2)自适应变异粒子群寻优代价敏感支持向量机模型参数。训练集和测试集预处
理,适应度评估,进行选择,粒子速度更新后用自适应变异粒子群算法重新初始化粒子,判
断是否满足终止精度或当前迭代次数是否等于最大迭代次数,若满足则输出最优误分类代
价参数C1,C2和最优核参数宽度值σ;否则重新进行自适应变异粒子群算法。

(3)建立代价敏感支持向量机模型及分类。根据第(2)步得到最佳参数,采用高斯
径向基核函数训练代价敏感支持向量机分类模型,把训练集得到模型对测试集样本进行分
类并对数据反归一化处理。

(4)评价分类模型性能指标分类准确率和耗时,如不符合要求则转至第(2)步,重
新设定自适应变异粒子群算法参数。

(5)比较真实值和预测值,得到模型对应的分类准确率。

具体参数寻优步骤如图3所示:

1.初始化自适应变异粒子群参数;

2.适应度计算;

3.寻找个体极值和群体极值;

4.粒子速度更新和位置更新;

5.粒子每次更新后,用一定概率重新初始化粒子;

6.重新进行粒子适应度计算;

7.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最
为当前最好的位置,完成个体极值和群体极值的更新;

8.终止条件检查,如果不满足终止标准,则转到步骤4,否则转至下一步;所述终止
标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;

9.输出终止迭代次数时粒子中的两个惩罚因子和核函数。

实施例3

为了验证该方法的有效性,本发明选取了重载机车车轮状态数据集进行了实验,
论证本方法的有效性和可靠性。实验中首先需要进行核函数的选择,确认该核函数在处理
数据不均衡的二分类问题有效性,从而确定自适应变异粒子群算法能够较好地对代价敏感
支持向量机分类模型的参数进行优化。

1.核函数的选择

目前在工程实践中,SVM常用的核函数种类主要有如下4种:

1)线性核函数

K(x,xi)=xTxi;

2)多项式核函数:

K(x,xi)=(δxTxi+r)d,δ>0;

3)高斯径向基核函数:

K(x,xi)=exp(-||x-xi||2/(2δ2)),δ>0;

4)两层感知机核函数:

K(x,xi)=tanh(δxTxi+r)。

式中,δ,r和d都是核参数,K为核函数。

在试验中采取不同的核函数,测试集预测分类准确率的对比(统一采用[0,1]归一
化)如表1所示:


表1不同核函数训练得到的准确率

表中svmtrain是LIBSVM工具箱中主要函数。

从表1分析可以发现,在解决重载机车车轮状态检测分类的问题中,采用高斯径向
基函数的支持向量机能够获得较高的分类准确率,因此在解决数据不均衡问题时也同样采
用高斯径向基函数作为代价敏感支持向量机的核函数。

2.标准支持向量机分类结果对比

为比较本发明提出自适应变异粒子群算法优化CS-SVM模型的性能,采用自适应变
异粒子群算法、遗传算法和网格搜索分别优化标准支持向量机的参数。其中,自适应变异粒
子群算法优化参数的SVM分类可视化图和分类结果图,如图5和图6所示。

图5表明,采用参数优化的标准支持向量机在解决重载机车车轮状态检测分类问
题的过程中,蠕滑区和故障区分类不均衡,会使分类超平面向故障区偏移,从而造成了如图
6所示的结果,故障区分类准确率远低于蠕滑区的分类准确率。

采用上述三种算法优化标准支持向量机参数,并进行分类,得到结果如表2所示:


表2参数优化的支持向量机分类结果

表2表明利用自适应变异粒子群算法获得的分类准确率高于遗传算法和网格算
法,并且耗时最短。蠕滑区准确率和故障区准确率的对比表明,蠕滑区具有较高的分类准确
率,而故障区分类准确率不高。由于机车运行过程中,蠕滑区样本远多于故障区的样本,在
使用标准支持向量机训练过程中,故障区数据过少,支持向量机训练不足,从而误判的情况
增多。

3.代价敏感支持向量机模型分类结果对比

针对此问题,选用RBF核函数作为支持向量机的核函数,同时采用代价敏感的支持
向量机解决类别不均衡,误分代价不等的问题。代价敏感的支持向量机需要优化惩罚参数
C1,C2和高斯径向基函数的宽度σ。

图7表明,粒子群进化代数为100代时终止进化,此时平均适应度值为97.80%接近
理想最优值。

由图10知,在20代左右,遗传算法的平均适应度达到稳定,进化代数为100代时终
止进化,此时平均适应度值为99.58%。

图8和11表明,采用代价敏感的支持向量机可以有效解决由于数据不均衡造成的
误分代价不等的问题。

分别采用不同算法得到代价敏感支持向量机的相关参数和分类准确率如表3和表
4所示:


表3参数优化的代价敏感支持向量机的相关参数


表4参数优化的代价敏感支持向量机的分类准确率

表3和表4结果表明,自适应变异粒子群算法优化参数的代价敏感支持向量机对机
车车轮状态检测有较高的分类准确率,在数据不均衡的两个区,有比较接近的准确率,相比
于标准的遗传算法耗时要短。网格搜索法耗时最长,准确率最低,在数据不均衡的情况下,
得到两个区准确率差别较大。自适应变异粒子群算法优化参数的CS-SVM采用结构风险最小
化原则和VC维理论,提高了模型的推广能力和精度,减少了依赖经验的程度。

图13表明采用自适应变异粒子群算法优化参数的CS-SVM的ROC曲线越接近左上
角,说明比自适应变异粒子群算法优化参数的标准支持向量机具有更好的分类性能。


表5SVM和CS-SVM的准确率和AUC的值比较

AUC(Area Under Curve)定义的是ROC曲线下的面积,对应的数值越大,代表分类
器的性能越好。表5表明自适应变异粒子群算法优化参数的CS-SVM的AUC值为0.9947大于自
适应变异粒子群算法优化参数的SVM的值。并且自适应变异粒子群算法优化参数的CS-SVM
的分类准确率明显优于自适应变异粒子群算法优化参数的SVM,表明了自适应变异粒子群
算法优化参数的CS-SVM模型的优越性。

显然,上述实施例仅仅是为清楚地说明本发明的技术方案所作的举例,而并非是
对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还
可以做出其它不同形式的变化或变动。凡在本发明的精神和原则之内所作的任何修改、等
同替换和改进等,均应包含在本发明权利要求的保护之内。

一种代价敏感支持向量机机车车轮检测系统及方法.pdf_第1页
第1页 / 共18页
一种代价敏感支持向量机机车车轮检测系统及方法.pdf_第2页
第2页 / 共18页
一种代价敏感支持向量机机车车轮检测系统及方法.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《一种代价敏感支持向量机机车车轮检测系统及方法.pdf》由会员分享,可在线阅读,更多相关《一种代价敏感支持向量机机车车轮检测系统及方法.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明公开了一种代价敏感支持向量机机车车轮状态检测系统及方法,所述系统包括数据预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判别模块和车轮状态输出模块;所述检测方法包括共八个步骤,所述参数寻优步骤采用自适应变异粒子群算法,该算法是一种变异粒子群算法,具有很强的鲁棒性和全局搜索特性等优点,拓展了在迭代中不断缩小的空间,在更大空间中开展搜索,同时保持了种群多样性。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 测量;测试


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1