一种移动核心网故障数据识别的几何判别方法技术领域
本发明涉及通讯网络领域,具体涉及一种移动核心网故障特征的识别方
法。
背景技术
目前国内外有关网络故障的识别方法和诊断技术主要有:
(1)基于图的故障诊断技术
基于图的故障诊断技术包括故障传播模型和故障定位技术。其中故障传播
模型主要有:基于依赖图的模型、基于因果图的模型和短语结构语法模型等。
Katzela and Schwartz(1995)提出了基于依赖图的模型用来解决通信网络环
境中的故障诊断问题。张小松,伦志新和窦炳琳(2005)基于依赖图的技术对
网络故障进行识别。Lo,Chen和Lin(2000)利用因果图模型研究通信网络的
故障识别问题,描述通信网络事件之间的因果关系。Chao,Yang和Liu(2001)
提出一种面向域的分级推理机制,它基于一个实证研究结果的精致网络故障传
播模型的因果关系图。他们根据该分级推理机制的原理,在一个多域环境里设
计了一个叫做告警关联视图的故障自动诊断系统。该系统不仅提供自动告警关
联的过程,还提供高效的故障定位与识别的功能。安若铭,安伟光和谷吉海
(2009)基于因果图的技术分析对网络诊断模型进行研究。Bouloutas,Calo
和Finkel(1994)通过建立短语结构语法模型研究了移动通信网络的关联告警
和故障识别问题。
故障定位技术主要有:基于代码本的故障定位技术、基于贝叶斯网络的故
障定位技术和渐增故障假设更新故障定位技术等。
(2)基于人工智能的故障诊断技术
基于人工智能的故障诊断技术应用非常广泛。人工智能技术是一种专家系
统,该系统通过模仿人类专家在解决特定领域时的行为来解决问题。专家系统
中知识库的知识,可以是从经验中获得的表面知识,也可以是通过理解系统行
为的工作原理而得到的深层知识。据专家系统所使用知识结构的不同,解决故
障定位问题主要有:基于规则的推理技术、基于模型的推理技术、基于范例的
推理技术、有限自动机技术、人工神经网络技术等。Frontini,Griffin和Towers
(1991)基于知识系统采用规则推理的确定性模型研究了广域网的故障定位问
题。Sehwartz,Adler,BIllmers(1995)和Steimann,Fr和Nejdl(1999)
采用基于模型的推理技术研究了通讯网络的故障问题。Lewis(1993)基于范
例的推理技术研究了通信网络中的故障管理问题。Amani,Fathi,Dehghan
(2005)基于范例的推理技术研究了通信网络中的告警滤波及关联问题。
Boulouta,Hart和Schwartz(1992,1993)提出有限自动机技术研究通信网
络异常数据检测和故障识别等问题。孙颖楷和曹龙汉(2000)利用基于粗糙集
理论的人工神经网络对故障进行诊断。
(3)基于线性模型的故障识别技术
基于线性模型的故障识别技术是采用移动核心网的性能数据,通过分析数
据的历史分布规律,从中抽象出异常数据或故障数据的特征,然后建立线性判
别模型来对新的样本数据进行异常数据或故障数据的识别。庞素琳,汪寿阳
(2010,2011)通过建立异常数据线性判别模型对移动核心网性能数据进行异
常数据判别分析,在实验中共采用某移动公司2009年7月份共81个BSC有
349920个数据,对异常数据判别的准确率达到100%。他们还提出一种二重联
合线性判别模型,用来对故障数据进行判别分析,对故障数据进行有效的识别。
在实验中共采用某移动公司2009年7月份共81个BSC有349920个数据,对
可疑故障数据判别的准确率达到100%。
(4)其他方法的故障诊断技术
在移动通信网络故障管理的研究中,除了以上介绍的几种方法外,还有其
他一些研究方法。Rouvellou and Hart(1995)基于概率有限状态机器分别建
立了故障和告警模型,其中故障模型是用来识别那些可能是不完全或不正确的
数据,告警模型是用来呈现大量的故障和噪声信息。Tang,Luo和Yang(2002)
根据在同一个时间点故障发生时将导致网络流量明显偏离正常网络流量的特
点,建立了基于网络流量的多重分形模型,用来对故障进行检测。Chao,Natu
和Sethi(2008)采用IP网络探测方法研究通信网络的故障隔离问题。Rathi
和Thanuskodi(2009)将基于首页代理可靠性协议(VHAHA)作为一个完整的系
统结构,把虚拟专用网络(VPN)扩展到移动Ipv6以支持网络性能可靠性,提供
并解决移动Ipv6注册地区的安全问题,便于故障检测和数据恢复。钟仕群,
朱程荣和齐邦(2006)利用贝叶斯网络集成方法建立了故障定位模型。郑秋华
等(2007,2008)利用拉格朗日松弛和次梯度法研究网络故障智能诊断的关键
技术。
发明内容
本发明的目的是提供一种移动核心网故障数据识别的几何判别方法。
本发明为达到上述目的,采用的技术方案如下:
本发明研究某个BSC的TRAU曲线突然大幅下降的现象,并将此现象称
为数据突降事件。进一步来说,本发明研究在数据突降事件中,TRAU数据突
然大幅度往下掉,并一直掉到0,形成“瀑布线”的极端现象。
所述TRAU曲线的建立方法为:用n表示时间点,n为[1,144]内任一整数,
n=1时表示时间0:00,n=144时表示时间23:50,n比下一个时间点n+1早
10分钟,在某一日n=144时,则n+1表示次日的第1个时间点;以n为横坐标,
以在n表示的时间采集到的TRAU数据为纵坐标,建立TRAU曲线。
很显然,当网络系统发生故障时,很多BSC的TRAU数据都会突然大幅
下降,并一直下降到0,所以网络系统发生故障的现象属于数据突降事件。但
反过来,当网络系统发生数据突降事件时,网络系统未必发生故障,原因是在
网络系统运行正常的情况下,系统重启时也会导致TRAU值突然下降到0。不
过,系统重启发生的数据突降事件,虽然不是由网络系统故障导致,但一样造
成用户通话突然中断或无法拨通或是短信息无法发出或是滞后发出等妨碍用
户通信的后果,同样影响用户正常的工作和生活,所以对用户来说这也是一种
“故障”现象。只是不同的是,系统重启时间短,对用户的影响小;网络系统
发生的故障持续时间长,对用户的影响大。为了区分这两种故障,本发明给出
如下两个定义:把时间维持在20分钟以内(不含20分钟)的网络异常现象称
为可疑故障,出现的时间点称为可疑故障点;而把时间维持在20分钟以上(含
20分钟)的网络异常现象称为告警型故障,出现的时间点称为告警型故障点。
可见上述定义是根据数据采集的区间来定义可疑故障和告警型故障的,因为数
据采集的粒度是10分钟。特别声明,除了系统重启之外,其他还有非网络故
障原因导致的TRAU值为0,比如无用户或信号受强干扰影响等,本发明不予
以考虑。
本发明继而给出可疑故障点和告警型故障点的定义:在某一条TRAU曲线
上,在任意三个连续的时间点n、n+1和n+2中,其中n为[1,144]内任一整数,
如果TRAU数据在区间[n,n+2]上两端点的取值均为非0值,但在中间时间点n+1
处的取值为0值,则称该TRAU曲线在区间[n,n+2]内产生可疑故障点,并且该
0值为可疑故障。在某一条TRAU曲线上,在任意k+2(k≥2)个连续的时间
点n、n+1、n+2、…、n+k、n+k+1中,其中n为[1,144]内任一整数。如果
TRAU数据在区间[n,n+k+1]上两端点的取值均大于0,但在区间内任一个非端点
的时间点的取值均为0值,则称该TRAU曲线在区间[n,n+k+1]内产生告警型故
障点,并称这k个连续的0值为k-告警型故障。
由于本发明采集到的TRAU数据粒度是10分钟,所以由上述定义可知,可
疑故障持续的时间是在20分钟以内,但不足20分钟。值得注意的是,如果TRAU
数据的粒度更小,就可以定义可疑故障持续的时间更短,比如如果采集到的
TRAU数据粒度是5分钟的,就可以把可疑故障持续的时间定义在10分钟以内,
不足10分钟。一旦故障时间持续到20分钟,就会在同一个时间区域内出现2
个故障点,由告警型故障点的定义知,此种情形为2-告警型故障点。将第二类
故障类型称为“告警型故障”,原因是当TRAU数据连续出现到两次0值时,就
要开始告警。
本发明进一部给出TRAU数据分类规则。假设n,n+1,n+2,…,n+k,n+k+1
是任意k+2(k≥2)个连续时间点,TRAU曲线在这k+2个连续时间点处的取
值分别为TRAU(n),TRAU(n+1),TRAU(n+2),…,TRAU(n+k),TRAU(n+k+1)。
显然,所有TRAU值都是非负数,所以在任意时间点n处都有TRAU(n)≥0。而对
于正常的TRAU值应有TRAU(n)>0,对于故障点则有TRAU(n)=0。在实际移动业
务中,数据采集失败的默认值也为0,但本发明不考虑这种情况。
于是可得到TRAU数据按“正常”、“可疑故障”和“告警型故障”的三类
模式分类划分方法如表1所示。
表1TRAU数据分类规则
本发明还提出了相似周期函数。由于一个BSC的TRAU曲线每天都历时24
小时,经过144个时间点,每日的走势大致相同,正常的TRAU曲线分布也一
样,不同的只是局部变化不同,所以一个BSC的TRAU曲线不是周期函数,但
它像周期函数,本发明将这样的函数称为相似周期函数。
一条正常(即不出现故障点)的TRAU曲线不是一个周期函数,因为在不
同日的同一个时间点上,打电话的人数或次数是不确定的,所以一条TRAU曲
线上的每一点都无法保证在不同日的值相等,因而TRAU曲线不是周期函数。
但由于对一条正常的TRAU曲线来说,在不同日的同一个时间点的TRAU数据相
差不大,而且分布相同,所以可以把TRAU曲线看成是一个相似的周期函数。
本发明将相似周期函数定义为:对于函数y=f(x),假定其分布函数为F(x),
如果存在一个不为零的常数T(T≠0),使得当x在其定义域R内取任意一
个值时,都有F(x+T)=F(x),这里F(x+T)是y=f(x+T)的分布函数,并且x和
x+T具有相同的定义域,即x,x+T∈R,那么就把函数y=f(x)叫做相似周期
函数,不为零的常数T叫做这个函数的相似周期。
由相似周期函数的定义可知,每一条正常的TRAU曲线都是相似周期函
数,其相似周期从时间来看是T=24(小时),从时间点来看是T=144(个
时间点)。在本发明中主要用时间点来研究,所以相似周期T=144。每一个
相似周期的时间点从n=1开始到n=144结束。因此当从日期来考虑时,上一
个相似周期的最后一个时间点(n=144)和本相似周期的第一个时间点
(n=1)是不相邻的,但从相似周期函数来看它们又是相邻的,本发明把这种
“相邻”现象称为不可达相邻点,并将其定义为:对于具有相似周期T(T≠0)
的相似周期函数y=f(x),A为其在某一相似周期内终点处的点,B为其在下
一相邻相似周期内初始点处的点,则A和B称为关于相似周期函数y=f(x)的
不可达相邻点。
在上述定义的基础上,本发明建立了故障点判定模型,从而判断某区间内
是否出现故障点。所述故障点判定模型为:
(I)若TRAU曲线在区间[n,n+2]内的点满足联立方程模型
y = - y 1 ( x - n - 1 ) - - - ( 1 ) y = y 2 ( x - n - 1 ) - - - ( 2 ) ]]>
的解,其中y1>0,y2>0,则BSC的TRAU数据在区间[n,n+2]内出现可疑故障
点;
(II)若TRAU曲线在区间[n,n+k+1]内最左端两点连线和最右端两点连线
的联立方程模型可描述为方程B,并且满足引理结论,则BSC的TRAU数据在区
间[n,n+k+1]内出现k-告警型故障点(k≥2):
a.当n与n+k属于同一天且n+k≤143时,方程B为:
y = - y 1 ( x - n - 1 ) - - - ( 1 ) y = y 2 ( x - n - k ) - - - ( 5 ) ]]>
b.当n与n+k属于同一天且n+k=144时,方程B为:
y = - y 1 ( x - n - 1 ) - - - ( 1 ) y = y 2 ( x - 144 ) - - - ( 8 ) ]]>
c.当n+k所属日期为n所属日期的次日且n=144时,n+k在次日对应的时
间点为k,方程B为:
y = - y 1 ( x - 1 ) - - - ( 10 ) y = y 2 ( x - k ) - - - ( 11 ) ]]>
d.当n+k所属日期为n所属日期的次日且n≤143时,n+k在次日对应的时
间点为n+k-144,有m=144-n,m<k,且方程B为:
y = - y 1 ( x - n - 1 ) - - - ( 1 ) y = y 2 ( x - k + m ) - - - ( 14 ) ]]>
所述引理结论为:
(1)TRAU曲线在区间[n,n+k+1]内最左端两点连线所在的直线方程斜率
k1<0;
(2)TRAU曲线在区间[n,n+k+1]内从左端第二个时间点起到右端倒数第二
个时间点止任意两点连线所在的直线方程斜率k2=0;
(3)TRAU曲线在区间[n,n+k+1]内最右端两点连线所在的直线方程斜率
k3>0。
对于模型中可疑故障点判定的充要性,证明如下:
令y1为TRAU曲线上位于第n个时间点所对应的TRAU值,其坐标为A(n,y1)。
y2为TRAU曲线上位于第n+2个时间点所对应的TRAU值,其坐标为B(n+2,y2)。
用O表示在时间段[n,n+2]的可疑故障点,则其坐标为O(n+1,0),且有y1>0,
y2>0。用线段分别连结AO和BO,则所得到的时间-TRAU示意图如图5所示。
假设(x,y)表示TRAU曲线在[n,n+2]内的任一点。
充分性:若TRAU曲线在该区间内的点满足联立方程模型(1)和(2)的解,
那么当x=n时,由式(1)知,y=y1>0。当x=n+2时,由式(2)知,故y=y2>0。
而当x=n+1时,由式(1)知,y=0,这说明TRAU曲线在区间[n,n+2]两端点
的值都是非0值而在其中间点n+1处的值为0。由可疑故障点的定义知,该TRAU
曲线在[n,n+2]内出现可疑故障点。
必要性:若TRAU曲线在时间点区间[n,n+2]内出现可疑故障点,则可设TRAU
曲线在第n、n+1、n+2这三个时间点的坐标分别为A(n,y(1)),O(n+1,0),
B(n+2,y(2)),其中y(1)>0且y(2)>0。于是AO所在直线的方程为:
y=-y(1)(x-n-1) (3)
BO所在直线的方程为:
y=y(2)(x-n-1) (4)
因为在方程(1)中,当x=n时,有y=y1,所以y(1)=y1。于是AO所在直线的方
程(3)为:
y=-y1(x-n-1) (1)
在方程(2)中,当x=n+2时,有y=y2,所以y(2)=y2。于是BO所在直线方程(4)
为:
y=y2(x-n-1) (2)
因此TRAU曲线在[n,n+2]内的点(x,y)满足联立方程模型(1)和(2)的解。证毕。
告警型故障点的识别模型方法要比可疑故障点的识别模型方法难度要大
得多,情形也复杂得多。在一天24小时内,不同的时间段发生的k-告警型故
障点(k≥2),其故障点的几何特征是不同的,因此识别的模型方法也是不同
的。为了方便研究各种情形下发生的k-告警型故障点,先给出以下引理:假
设n为[1,144]内任一整数,某BSC的TRAU曲线在区间[n,n+k+1](k≥2)内
出现k-告警型故障点,则有以下结论成立:
(1)TRAU曲线在该区间内最左端两点连线所在的直线方程斜率k1<0;
(2)TRAU曲线在该区间内从左端第二个时间点起到右端倒数第二个时间点
止任意两点连线所在的直线方程斜率k2=0;
(3)TRAU曲线在该区间内最右端两点连线所在的直线方程斜率k3>0。
引理证明如下:若某BSC的TRAU曲线在区间[n,n+k+1](k≥2)内出现k-
告警型故障点,则由告警型故障点的定义知,TRAU数据在该区间内两端点的取
值均为非0值,但在区间内任一个非端点的时间点的取值均为0值,分别用A、
C表示TRAU曲线的第n和第n+1个时间点(即区间最左端的两个时间点),分
别用D、B表示TRAU曲线的第n+k和第n+k+1个时间点(即区间最右端的两
个时间点),如图6所示。
于是再由告警型故障点的定义知,TRAU曲线在A和B点的取值都大于0,
在C和D点的取值都等于0。为方便,不妨用TRAU(·)来表示该TRAU曲线在某一
点的取值。于是,此该TRAU曲线的几何变化特征为:
(1)由于TRAU(A)>0,TRAU(C)=0,且n+1>n,所以该TRAU曲线在该区间
内最左端两点连线AC所在的直线方程斜率k1<0;
(2)由于TRAU(C)=TRAU(D)=0,且n+k>n+1(因为k≥2),所以该TRAU
曲线在该区间内从左端第二个时间点起到右端倒数第二个时间点止任意两点
连线CD所在的直线方程斜率k2=0;
(3)由于TRAU(D)=0,TRAU(B)>0,且n+k+1>n+k,所以该TRAU曲线在
该区间内最右端两点连线DB所在的直线方程斜率k3>0。证毕。
在此基础上讨论四种情况的k-告警型故障点(k≥2)的几何特征以及几
何模型识别方法。
a.当n与n+k属于同一天且n+k≤143时,表示某BSC在某一日发生故障,
但能在当日(即在次日凌晨0:00时之前)被修复。具体描述如下:
假设某BSC的TRAU曲线在A(n,y1)(y1>0)点处突然下降,并在下一个
时间点n+1处下降到0值,记该点为C,则其坐标为C(n+1,0),此后连续出现k
(k≥2)个故障点,最后一个故障点为D(n+k,0),并在第n+k+1个时间点处恢
复正常,其坐标为B(n+k+1,y2)(y2>0),如图6所示。
对情况a的判定的充要性证明如下:
证明:假设(x,y)表示TRAU曲线在[n,n+k+1]内的任一点。
充分性:由于该TRAU曲线在该区间内最左端两点连线和最右端两点连线
的联立方程模型可描述为(1)和(5),并且引理结论成立,所以
①当x=n时,由式(1)得y=y1。当x=n+1时,由式(1)得y=0。于是TRAU
曲线在该区间内最左端两点A和C的坐标为A(n,y1)、C(n+1,0),所以最左端
两点A和C连线的方程的斜率为:
k 1 = y 1 - 0 n - ( n + 1 ) = - y 1 - - - ( 6 ) ]]>
由引理结论(1)知,k1<0,所以y1>0。
②因为TRAU曲线在该区间内从左端第二个时间点起到右端倒数第二个时
间点止任意两点连线方程的斜率k2=0,因此如果TRAU曲线在该区间内某一点
的值不为0(则必然大于0),比如假设TRAU曲线在第n+i∈(n+1,n+k)(1<i<k)
个时间点处所对应的值y(i)>0,不妨记该点为E(n+i,y(i)),则E点与C点连线的
方程斜率为:
k EC = y ( i ) - 0 n + i - ( n + 1 ) = 1 i - 1 y ( i ) > 0 - - - ( 7 ) ]]>
式(7)与引理结论(2)有矛盾。所以TRAU曲线在该区间内没有不为0的值,或
者说TRAU曲线在该区间内从左端第二个时间点起到右端倒数第二个时间点止
任一点的值都为0。
③由式(5)及引理结论(3),与本情况a充分性中①同理的证明方法可知,
TRAU曲线在该区间内最右端两点D和B的坐标为D(n+k,0)和B(n+k+1,y2)并
且y2>0。
由k-告警型故障点的定义知,TRAU数据在区间[n,n+k+1](k≥2)内出现
k-告警型故障点。
必要性:若TRAU数据在区间[n,n+k+1](k≥2)内出现k-告警型故障点,
则由k-告警型故障点的定义知,TRAU曲线在该区间内最左端两点A和C的坐
标为A(n,y1)、C(n+1,0),在该区间内最右端两点D和B的坐标为D(n+k,0)和
B(n+k+1,y2)并且y1>0,y2>0。于是AC所在直线的方程为:
y=-y1(x-n-1) (1)
DB所在直线的方程为:
y=y2(x-n-k) (5)
因此TRAU曲线在该区间内最左端两点连线和最右端两点连线可用联立方程模
型(1)和(5)描述。并且
(1)TRAU曲线在该区间内最左端两点连线AC的直线方程(1)的斜率为
k1=-y1<0。
(2)由k-告警型故障点的定义知,TRAU数据在区间[n,n+k+1](k≥2)内
从左端第二个时间点起到右端倒数第二个时间点止的值都为0,因此TRAU数据
在区间[n,n+k+1](k≥2)内从左端第二个时间点起到右端倒数第二个时间点
止任意两点连线的直线方程斜率k2=0。
(3)TRAU曲线在该区间内最右端两点连线DB所在直线方程(5)的斜率为
k3=y2>0。
所以引理结论成立。证毕。
b.当n与n+k属于同一天且n+k=144时,表示某BSC在某一日发生故障,
但在次日凌晨0:00时才被修复。具体描述如下:
假设某BSC的TRAU曲线在A(n,y1)(y1>0)点处突然下降,并在下一个
时间点n+1处下降到0值,其在横坐标轴上的点为C,则其坐标为C(n+1,0),
并在此后连续出现k(k≥2)个故障点,最后一个故障点位于当日最后一个时
间点144,记该点为D,则其坐标为D(144,0)。此意指该故障在次日凌晨0:00
点(也可以说是在次日第1个时间点)被修复,,此时设该BSC的TRAU曲线位
于B(1,y2)(y2>0)点处,如图7所示。
对情况b的判定的充要性证明如下:
证明:假设(x,y)表示TRAU曲线在该时间点序列中的任一点。
充分性:由于该TRAU曲线在该区间内最左端两点连线和最右端两点连线
的联立方程模型可描述为(1)和(8),并且引理结论成立,所以
①和情况a充分性证明中的①一样的证明方法可知,TRAU曲线在该时间点
序列中的第n和第n+1个时间点(即该序列中最左端两点)所对应的点A和C的
坐标为A(n,y1)和C(n+1,0),并且y1>0。
②和情况a充分性证明中的②一样的证明方法可知,TRAU曲线在该序列内
从左端第二个时间点起到右端倒数第二个时间点止任一点的值都为0。
③由式(8)知,当x=144时,y=0,这说明TRAU曲线在当日第144时间点
的坐标为D(144,0)。因为当日的第144个时间点是本日的最后一个时间点,其
下一个时间点是次日的第1个时间点。记TRAU曲线在次日的第1个时间点对
所应对的点为B(1,y2),则y2≥0。若y2=0,则BD的斜率为0,与引理结论(3)
有矛盾,所以必有y2>0。
由k-告警型故障点的定义知,TRAU数据在该序列内出现k-告警型故障
点。
必要性:若TRAU数据在时间点序列:n,n+1,…,144及次日的第1个
时间点出现k-告警型故障点(k≥2),则由k-告警型故障点的定义知,TRAU
曲线在该序列内最左端两点A和C的坐标为A(n,y1)、C(n+1,0),在该序列内
最右端两点D和B的坐标为D(144,0)和B(1,y2),并且y1>0,y2>0。于是AC所
在直线的方程为:
y=-y1(x-n-1) (1)
BD所在直线的方程为:
y=-143y2(x+144) (9)
对DB所在直线方程(9),其斜率为k3=-143y2,因为y2>0,所以k3<0,这
说明DB所在直线的斜率为负值。但由图7知,BD所在直线的方向应使其斜率
为一正值,这就出现了矛盾。出现这种矛盾的原因是在当日的第144个时间点
之后紧接着是次日的第1个时间点,由不可达相邻点的定义知,B和D是不可
达相邻点,从而出现了数据逻辑错误,因此方程(9)不能正确描述直线DB的方
程,为此我们需要另用其他方法解决。解决的方法如下:
将线段BD沿着BD方向延长至B′点,使BD=DB′,于是B′的坐标为
B′(143,-y2),并用DB′所在的直线方程描述DB所在的直线方程。如图8所示。
于是DB′所在的直线方程为:
y=y2(x-144) (8)
因此TRAU曲线在该序列内最左端两点连线和最右端两点连线可用联立方程模
型(1)和(8)描述。并且
(1)TRAU曲线在该序列内最左端两点连线AC的直线方程(1)的斜率为
k1=-y1<0。
(2)由k-告警型故障点的定义知,TRAU数据在序列内从左端第二个时间点
起到右端倒数第二个时间点止的值都为0,因此TRAU数据在该序列内从左端第
二个时间点起到右端倒数第二个时间点止任意两点连线的直线方程斜率
k2=0。
(3)TRAU曲线在该序列内最右端两点连线DB所在直线方程实际上是DB′
所在的直线方程(8)的斜率为k3=y2>0。
所以引理结论成立。证毕。
c.当n+k所属日期为n所属日期的次日且n=144时,表示某BSC在某一日
最后一个时间点144的TRAU数据还是正常值,但在次日凌晨0:00时突然发
生故障,但本次故障能在次日修复。具体描述如下:
假设某BSC的TRAU曲线在某一日的A(144,y1)(y1>0)点处突然下降,并
在次日凌晨或者说是在次日的第1个时间点处下降到0值,记该点为C,则其
坐标为C(1,0),并在此后连续出现k(k≥2)个故障点,最后一个故障点位于
D(k,0),并在第k+1个时间点处被修复,此时设该BSC的TRAU曲线位于
B(k+1,y2)(y2>0)点处,如图9所示。
对情况c的判定的充要性证明如下:
证明:假设(x,y)表示TRAU曲线在该时间点序列中的任一点。
充分性:由于该TRAU曲线在该区间内最左端两点连线和最右端两点连线
的联立方程模型可描述为(10)和(11),并且引理结论成立,所以
①当x=1时,由式(10)得y=0,所以该TRAU曲线在该序列中左端第二个
时间点所对应的点C坐标为C(1,0)。记TRAU曲线在当日最后一个时间点144
对所应对的点为A(144,y1),则y1≥0。若y1=0,则CA的斜率为0,与引理结论
(3)有矛盾,所以必有y1>0。
②和情况a充分性证明中的②一样的证明方法可知,TRAU曲线在该序列内
从左端第二个时间点起到右端倒数第二个时间点止任一点的值都为0。
③由式(11)知,当x=k时,y=0,记该点为D(k,0)。再记TRAU曲线在该
序列最后一个时间点即第k+1个时间点处对所应对的点为B(k+1,y2),D和B连
线所在的直线方程的斜率为:
k 3 = y 2 - 0 ( k + 1 ) - k = y 2 - - - ( 12 ) ]]>
因为k3>0,所以y2>0。
由k-告警型故障点的定义知,TRAU数据在该序列内出现k-告警型故障
点。
必要性:若该TRAU在当日最后一个时间点144及次日时间点序列:1,2,…,
k,k+1出现k-告警型故障点(k≥2),则由k-告警型故障点的定义知,TRAU
曲线在该序列内最左端两点A和C的坐标为A(144,y1)和C(1,0),在该序列内最
右端两点D和B的坐标为D(k,0)和B(k+1,y2),并且y1>0,y2>0。于是AC所
在直线的方程为:
y = y 1 143 ( x - 1 ) - - - ( 13 ) ]]>
对直线方程(13),其斜率为因为y1>0,所以k1>0,这说明AC所
在直线方程(13)的斜率为正值。但由图9知,AC所在直线的方向应使其斜率
为一负值,这就出现了矛盾。出现这种矛盾的原因是在当日的第144个时间点
之后紧接着是次日的第1个时间点,这两个A和C是不可达相邻点,从而出现
了数据逻辑错误。因此方程(13)不能正确描述直线AC的方程,为此我们需要
另用其他方法解决。解决的方法如下:
将线段AC沿着从A到C的方向延长至A′点,使AC=CA′。于是A′的坐标为
A′(2,-y1),并用CA′所在的直线方程描述AC所在的直线方程。如图10所示。于
是CA′所在的直线方程为:
y=-y1(x-1) (10)
另一方面,BD所以直线的方程为:
y=y2(x-k) (11)
因此TRAU曲线在该序列内最左端两点连线和最右端两点连线可用联立方程模
型(10)和(11)描述。并且
(1)TRAU曲线在该序列内最左端两点连线CA所在直线方程的斜率实际上
是CA′所在的直线方程(10)的斜率,所以CA所在直线方程的斜率实际为
k1=-y1<0。
(2)由k-告警型故障点的定义知,TRAU数据在序列内从左端第二个时间点
起到右端倒数第二个时间点止的值都为0,因此TRAU数据在该序列内从左端第
二个时间点起到右端倒数第二个时间点止任意两点连线的直线方程斜率
k2=0。
(3)TRAU曲线在该序列内最右端两点连线DB所在直线方程(11)的斜率为
k3=y2>0。
所以引理结论成立。证毕。
d.当n+k所属日期为n所属日期的次日且n≤143时,有m=144-n,m<k,
n+k在次日对应的时间点为n+k-144即k-m,表示某BSC在某一日发生故障,
次日凌晨0:00点后(但不含0:00点)才能修复。具体描述如下:
假设某BSC的TRAU曲线在A(n,y1)(y1>0)点处突然下降,并在下一个
时间点n+1处下降到0值,记该点为C,则其坐标为C(n+1,0),此后连续出现k
(k≥2)个故障点。该情形考虑某一种故障在当日发生,并于次日0:00点后
(但不含0:00点)才修复好。于是可以假设当日有m(m<k)个故障点,次
日的最后一个故障点位于D(k-m,0),并在第k-m+1个时间点处恢复正常,其
坐标为B(k-m+1,y2)(y2>0),如图11所示。
对情况d的判定的充要性证明如下:
证明:假设(x,y)表示TRAU曲线在该时间点序列中的任一点。
充分性:由于该TRAU曲线在该区间内最左端两点连线和最右端两点连线
的联立方程模型可描述为(1)和(14),并且引理结论成立,所以
①和情况a充分性证明中的①一样的证明方法可知,TRAU曲线在该时间点
序列中的第n和第n+1个时间点(即该序列中最左端两点)所对应的点A和C的
坐标为A(n,y1)和C(n+1,0),并且y1>0。
②和情况a充分性证明中的②一样的证明方法可知,TRAU曲线在该序列内
从左端第二个时间点起到右端倒数第二个时间点止任一点的值都为0。
③由式(14)知,当x=k-m时,y=0,记该点为D(k-m,0)。再记TRAU曲线
在该序列最后一个时间点即第k-m+1个时间点处对所应对的点为
B(k-m+1,y2),D和B连线所在的直线方程的斜率为:
k 3 = y 2 - 0 ( k - m + 1 ) - ( k - m ) = y 2 - - - ( 15 ) ]]>
因为k3>0,所以y2>0。
由k-告警型故障点的定义知,TRAU数据在该序列内出现k-告警型故障
点。
必要性:若TRAU数据从当日第n个时间点起并在当日历时了m个时间点后
一直到次日第k-m(m<k)(k≥2)个时间点止出现k-告警型故障点,则由k-
告警型故障点的定义知,TRAU曲线在该序列内最左端两点A和C的坐标为
A(n,y1)和C(n+1,0),在该区间内最右端两点D和B的坐标为D(n-k,0)和
B(n-k+1,y2),并且y1>0,y2>0。于是AC所在的直线的方程为:
y=-y1(x-n-1) (1)
BD所以直线的方程为:
y=y2(x-k+m) (14)
因此TRAU曲线在该序列内最左端两点连线和最右端两点连线可用联立方程模
型(1)和(14)描述。并且
(1)TRAU曲线在该序列内最左端两点连线AC的直线方程(1)的斜率为
k1=-y1<0。
(2)由k-告警型故障点的定义知,TRAU数据在序列内从左端第二个时间点
起到右端倒数第二个时间点止的值都为0,因此TRAU数据在该序列内从左端第
二个时间点起到右端倒数第二个时间点止任意两点连线的直线方程斜率
k2=0。
(3)TRAU曲线在该区间内最右端两点连线DB的直线方程(14)的斜率为
k3=y2>0。
所以引理结论成立。证毕。
本发明把三个引理结论称为“故障几何特征”。故障几何特征很好地描述
了网络系统在发生故障时TRAU曲线的故障变化情况,但故障几何特征只是故
障发生的必要条件,该条件并不充分,所以在故障识别的充要判据中不能去掉,
也不能做为一个独立的条件对故障进行识别。
本发明提供了一种移动核心网故障数据识别的几何判别方法,其有益效果
如下:给出的识别方法在应用过程中非常便利,这种识别方法不需要了解历史
数据的分布规律,也不需要一定的样本量作为训练样本。采用这种方法时,可
直接从某一日的第一个时间点开始,比如从时间0:00开始,对每两个相邻点
或不可达相邻点之间建立直线方程模型,对每三个连续相邻点建立联立方程模
型模型,然后根据本发明给出的五个故障识别充要判据,就可识别出BSC当前
的TRAU数据是正常的还是出现了故障。如果是出现了故障,是属于可疑故障
点还是告警型故障点。因此,本发明给出的故障识别方法能有效识别TRAU数
据中的可疑故障点和告警型故障点。
附图说明
图1:81个BSC在2009年7月1日的TRAU曲线图;
图2:DGM07B1在2009年7月1日的TRAU曲线图;
图3:DGM17B3在2009年7月1日的TRAU曲线图;
图4:81个BSC在2009年7月7日的TRAU曲线图;
图5:可疑故障点示意图;
图6:当日被修复的k-告警型故障示意图;
图7:凌晨0:00点被修复的k-告警型故障示意图(a);
图8:凌晨0:00点被修复的k-告警型故障示意图(b);
图9:凌晨故障当日修复的k-告警型故障示意图(a);
图10:凌晨故障当日修复的k-告警型故障示意图(b);
图11:当日故障次日修复的k-告警型故障示意图。
具体实施方式
实施例1
本实施例数据来源于某移动公司核心网性能数据,数据采集的时间和范围
是2009年7月1~30日81个BSC的TRAU数据(注:31日的数据采集有问
题,数据默认值都为0,故不采用),数据粒度为10分钟,即10分钟采集一次
数据,故一天24小时就有144个数据。为了便于对数据的分析,先通过这81
个BSC在7月1日24小时内的TRAU曲线图来观察其数据的变化情况。作图
时,从时间0:00起,把0:00的TRAU值作为第1个时间点,把0:10的TRAU
值作为第2个时间点,以此类推,23:50的TRAU值就是第144个时间点。于
是这81个BSC在7月1日24小时内的TRAU曲线变化如图1所示。
从图1中看到,大多数BSC在2009年7月1日这一天的分布很有规律,
相应的TRAU曲线都非常平稳光滑,没有突升或突降的现象。比如单看一个
DGM07B1曲线,其TRAU在这一天的变化很有规律,在这一天24小时内,
没有一个TRAU值突然下降到0,即从第1个时间点起直到最后第144个时间
点,所有的TRAU值都大于0。这种属于正常的BSC,如图2所示。
但同时注意到,图1中还有一些BSC曲线,其TRAU值在某一个时间点
的正常数值突然下降到0,形成“瀑布线”。比如,DGM17B3在2009年7月
1日这一天的TRAU曲线图中,在两个时间段[17:10,17:30](对应的时间点
区间是[104,106])和[18:40,18:50](对应的时间点区间是[113,114])的
TRAU值都突然下降到0,如图3所示。
经观察还发现,这81个BSC在2009年7月7日这一天在两个不同的时
间段[11:00,11:30](对应的时间点区间是[67,70])和[12:00,12:30](对
应的时间点区间是[73,76])都出现所有的BSC突然下降到0,而且每次都维
持30分钟的时间。这显然是非常严重的故障现象,如图4所示。
利用本发明的移动核心网故障数据识别的几何判别方法对采集到的数据
中的故障点进行识别。
(1)建立TRAU曲线:用n表示时间点,n为[1,144]内任一整数,n=1
时表示时间0:00,n=144时表示时间23:50,n比下一个时间点n+1早10
分钟,在某一日n=144时,则n+1表示次日的第1个时间点;以n为横坐标,以
在n表示的时间采集到的TRAU数据为纵坐标,建立TRAU曲线。
(2)通过故障点判定模型判断某区间内是否出现故障点:
(I)若TRAU曲线在区间[n,n+2]内的点满足联立方程模型
y = - y 1 ( x - n - 1 ) y = y 2 ( x - n - 1 ) ]]>
的解,其中y1>0,y2>0,则BSC的TRAU数据在区间[n,n+2]内出现可疑故障
点;
(II)若TRAU曲线在区间[n,n+k+1]内最左端两点连线和最右端两点连线
的联立方程模型可描述为方程B,并且满足引理结论,则BSC的TRAU数据在区
间[n,n+k+1]内出现k-告警型故障点(k≥2):
a.当n与n+k属于同一天且n+k≤143时,方程B为:
y = - y 1 ( x - n - 1 ) y = y 2 ( x - n - k ) ]]>
b.当n与n+k属于同一天且n+k=144时,方程B为:
y = - y 1 ( x - n - 1 ) y = y 2 ( x - 144 ) ]]>
c.当n+k所属日期为n所属日期的次日且n=144时,n+k在次日对应的时
间点为k,方程B为:
y = - y 1 ( x - 1 ) y = y 2 ( x - k ) ]]>
d.当n+k所属日期为n所属日期的次日且n≤143时,n+k在次日对应的时
间点为n+k-144,有m=144-n,m<k,且方程B为:
y = - y 1 ( x - n - 1 ) y = y 2 ( x - k + m ) ]]>
所述引理结论为:
(1)TRAU曲线在区间[n,n+k+1]内最左端两点连线所在的直线方程斜率
k1<0;
(2)TRAU曲线在区间[n,n+k+1]内从左端第二个时间点起到右端倒数第二
个时间点止任意两点连线所在的直线方程斜率k2=0;
(3)TRAU曲线在区间[n,n+k+1]内最右端两点连线所在的直线方程斜率
k3>0。
将采集到的TRAU数据利用上述方法进行识别,对故障点的判断达到了
100%的准确率,可见本发明给出的故障识别方法能有效识别TRAU数据中的故
障点。