一种应用于服务端的运维监控方法和装置.pdf

上传人:111****11 文档编号:1306107 上传时间:2018-04-14 格式:PDF 页数:22 大小:1.53MB
返回 下载 相关 举报
摘要
申请专利号:

CN201611146090.0

申请日:

2016.12.13

公开号:

CN106708700A

公开日:

2017.05.24

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 11/30申请日:20161213|||公开

IPC分类号:

G06F11/30; G06F11/32

主分类号:

G06F11/30

申请人:

广东金赋科技股份有限公司

发明人:

张伟昌; 许晓炼; 何伟强

地址:

528200 广东省佛山市南海区桂城深海路17号瀚天科技城A区5号楼3楼4区

优先权:

专利代理机构:

北京易捷胜知识产权代理事务所(普通合伙) 11613

代理人:

齐胜杰

PDF下载: PDF下载
内容摘要

本发明涉及一种应用于服务端的运维监控方法与装置。该方法包括:根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策略映射;认证安全监控配置包括服务端应用服务负载指标阈值和操作映射,在服务端出现问题前发现问题,避免问题对服务端产生的影响。

权利要求书

1.一种应用于服务端的运维监控方法,其特征在于,所述方法包括:
101,获取资源监控配置、服务监控配置、日志监控配置和认证安全监控配置;
所述资源监控配置包括所述服务端的性能指标、数量、服务进程指标和处理标识映射;
所述服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射和异常处理策略;
所述日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策
略映射;
所述认证安全监控配置包括所述服务端应用服务负载指标阈值和操作映射;
102,根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对所述服
务端进行实时监控;
103,存储监控操作记录和监控数据。
2.根据权利要求1所述的方法,其特征在于,根据资源监控配置对所述服务端进行监
控,包括:
根据所述资源监控配置获取所述服务端的中央处理器CPU、内存、网络带宽、输入输出
IO读写、磁盘空间、占据资源最大的前5位进程、网络带宽占用;
根据处理标识映射清除配置参数白名单外的CPU进程、内存进程、带宽进程、IO读写进
程、清除配置参数白名单外的目录磁盘空间;
根据服务监控配置对所述服务端进行监控,包括:
根据服务接口类别、服务接口测试列表、服务接口性能报文、服务监控结果、评估参数
映射,通过服务接口报文监控服务的正确性以及性能响应数据;
若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性;
根据日志监控配置对所述服务端进行监控,包括:
根据日志路径、日志类别、日志关键字、日志内容识别确定日志是否异常;
根据指引处理策略映射处理异常日志;
根据认证安全监控配置对所述服务端进行监控,包括:
根据所述服务端负载情况对比所述服务端应用服务负载指标阈值,对新接入的网络之
间互连的协议IP客服端优先级、频度进行分析;
根据所述操作映射处置所述新接入的IP客服端。
3.根据权利要求2所述的方法,其特征在于,通过如下公式计算任一进程占据资源,

Ri为进程i占据资源,为进程i实际占用资源,为各进程实际占用资源总和,Rall
为所述服务端额定资源;
获取占据资源最大的前5位进程,包括:
获取预先设置的占据资源阈值;
获取大于所述占据资源阈值的最大的前5位进程。
4.根据权利要求1或2或3所述的方法,其特征在于,步骤103执行之后,还包括:
104-1,获取综合阈值和对应处置映射;
104-2,根据所述综合阈值评估存储的监控操作记录和监控数据;
104-3,根据评估结果和对应处置映射确定处置方案;
104-4,根据所述处置方案分析处理所述存储的监控操作记录和监控数据;
104-5,存储处置操作记录和处置数据。
5.根据权利要求4所述的方法,其特征在于,步骤103执行之后,还包括:
105-1,获取通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式和监控
操作记录的明细程度标识;
105-2,根据通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操
作记录的明细程度标识发送预警消息通知;
105-3,存储预警操作记录和预警数据。
6.一种应用于服务端的运维监控装置,其特征在于,所述装置包括:资源监控管理模
块、服务监控管理模块、日志监控管理模块、认证安全管理模块、配置参数管理模块;
所述配置参数管理模块,用于存储资源监控配置、服务监控配置、日志监控配置和认证
安全监控配置;
所述资源监控配置包括所述服务端的性能指标、数量、服务进程指标和处理标识映射;
所述服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射和异常处理策略;
所述日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策
略映射;
所述认证安全监控配置包括所述服务端应用服务负载指标阈值和操作映射;
所述资源监控管理模块,用于从所述配置参数管理模块中获取资源监控配置,根据资
源监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;
所述服务监控管理模块,用于从所述配置参数管理模块中获取服务监控配置,根据服
务监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;
所述日志监控管理模块,用于从所述配置参数管理模块中获取日志监控配置,根据日
志监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;
所述认证安全管理模块,用于从所述配置参数管理模块中获取认证安全监控配置,根
据认证安全监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据。
7.根据权利要求6所述的装置,其特征在于,所述资源监控管理模块,用于根据所述资
源监控配置获取所述服务端的中央处理器CPU、内存、网络带宽、输入输出IO读写、磁盘空
间、占据资源最大的前5位进程、网络带宽占用;根据处理标识映射清除配置参数白名单外
的CPU进程、内存进程、带宽进程、IO读写进程、清除配置参数白名单外的目录磁盘空间;
所述服务监控管理模块,用于根据服务接口类别、服务接口测试列表、服务接口性能报
文、服务监控结果、评估参数映射,通过服务接口报文监控服务的正确性以及性能响应数
据;若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性;
所述日志监控管理模块,用于根据日志路径、日志类别、日志关键字、日志内容识别确
定日志是否异常;根据指引处理策略映射处理异常日志;
所述认证安全管理模块,用于根据所述服务端负载情况对比所述服务端应用服务负载
指标阈值,对新接入的网络之间互连的协议IP客服端优先级、频度进行分析;根据所述操作
映射处置所述新接入的IP客服端。
8.根据权利要求6或7所述的装置,其特征在于,所述配置参数管理模块,用于存储综合
阈值和对应处置映射;
所述装置还包括:综合控制管理模块;
所述综合控制管理模块,用于从所述配置参数管理模块中获取综合阈值和对应处置映
射;根据所述综合阈值评估存储的监控操作记录和监控数据;根据评估结果和对应处置映
射确定处置方案;根据所述处置方案分析处理所述存储的监控操作记录和监控数据;存储
处置操作记录和处置数据。
9.根据权利要求8所述的装置,其特征在于,所述配置参数管理模块,用于存储通知方
式、内容明细、频度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标
识;
所述装置还包括:消息通知管理模块;
所述消息通知管理模块,用于从所述配置参数管理模块中获取通知方式、内容明细、频
度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标识;根据通知方
式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操作记录的明细程度标识
发送预警消息通知;存储预警操作记录和预警数据。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:数据存储管理模块;
所述数据存储管理模块,用于管理资源监控管理模块、服务监控管理模块、日志监控管
理模块、认证安全管理模块存储的监控操作记录和监控数据,管理综合控制管理模块存储
的处置操作记录和处置数据,管理消息通知管理模块存储的预警操作记录和预警数据。

说明书

一种应用于服务端的运维监控方法和装置

技术领域

本发明涉及运维监控方法,尤其是涉及一种应用于服务端的运维监控方法与装
置。

背景技术

随着计算机互联技术不断发展,信息量呈爆炸性的增长,当前全球每天产生信息
量有10亿GB,数据非常庞大。尤其,近来来提出了互联网+、物联网、大数据、云计算等技术或
概念,更是把计算机互联技术推向前所未有的高度。这些依赖计算机互联的技术或概念都
有一个共同点,就是必须依赖一个或若干个应用服务端。然而,在日常生活中,几乎所有使
用的具备互联功能的软件产品、手机app(Application,应用)同样会依赖着应用服务端,它
就像一个中枢大脑提供着各种应用的服务,同时也管控着各种接入的应用。由此可见,服务
端应用服务的正确性、稳定性、安全性、可靠性以及性能响应等将会是正常运作的重要因
素。

当前服务端应用服务的管理技术水平不一,主要表现出管控技术单元碎片化、管
理人工化等。其中一些较为重要的服务端应用服务技术保障手段往往比较单一,主要表现
是仅监控服务调用方面或仅监控应用服务中间件等,出现问题之后的处理往往都是比较滞
后的与被动的。

发明内容

(一)要解决的技术问题

为了在问题出现前发现问题,本发明提供一种应用于服务端的运维监控方法与装
置,根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对服务端进行实
时监控,其中,资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映射;
服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性能报文、
服务监控结果、评估参数映射和异常处理策略;日志监控配置包括日志路径、日志类别、日
志关键字、日志内容识别和指引处理策略映射;认证安全监控配置包括服务端应用服务负
载指标阈值和操作映射,在服务端出现问题前发现问题,避免问题对服务端产生的影响。

(二)技术方案

为了达到上述目的,本发明采用的主要技术方案包括:

一种应用于服务端的运维监控方法,该方法包括:

101,获取资源监控配置、服务监控配置、日志监控配置和认证安全监控配置;

所述资源监控配置包括所述服务端的性能指标、数量、服务进程指标和处理标识
映射;

所述服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接
口性能报文、服务监控结果、评估参数映射和异常处理策略;

所述日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处
理策略映射;

所述认证安全监控配置包括所述服务端应用服务负载指标阈值和操作映射;

102,根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对所
述服务端进行实时监控;

103,存储监控操作记录和监控数据。

可选地,根据资源监控配置对所述服务端进行监控,包括:

根据所述资源监控配置获取所述服务端的中央处理器CPU、内存、网络带宽、输入
输出IO读写、磁盘空间、占据资源最大的前5位进程、网络带宽占用;

根据处理标识映射清除配置参数白名单外的CPU进程、内存进程、带宽进程、IO读
写进程、清除配置参数白名单外的目录磁盘空间;

根据服务监控配置对所述服务端进行监控,包括:

根据服务接口类别、服务接口测试列表、服务接口性能报文、服务监控结果、评估
参数映射,通过服务接口报文监控服务的正确性以及性能响应数据;

若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性;

根据日志监控配置对所述服务端进行监控,包括:

根据日志路径、日志类别、日志关键字、日志内容识别确定日志是否异常;

根据指引处理策略映射处理异常日志;

根据认证安全监控配置对所述服务端进行监控,包括:

根据所述服务端负载情况对比所述服务端应用服务负载指标阈值,对新接入的网
络之间互连的协议IP客服端优先级、频度进行分析;

根据所述操作映射处置所述新接入的IP客服端。

可选地,通过如下公式计算任一进程占据资源,


Ri为进程i占据资源,为进程i实际占用资源,为各进程实际占用资源总
和,Rall为所述服务端额定资源;

获取占据资源最大的前5位进程,包括:

获取预先设置的占据资源阈值;

获取大于所述占据资源阈值的最大的前5位进程。

可选地,步骤103执行之后,还包括:

104-1,获取综合阈值和对应处置映射;

104-2,根据所述综合阈值评估存储的监控操作记录和监控数据;

104-3,根据评估结果和对应处置映射确定处置方案;

104-4,根据所述处置方案分析处理所述存储的监控操作记录和监控数据;

104-5,存储处置操作记录和处置数据。

可选地,步骤103执行之后,还包括:

105-1,获取通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式和
监控操作记录的明细程度标识;

105-2,根据通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监
控操作记录的明细程度标识发送预警消息通知;

105-3,存储预警操作记录和预警数据。

除此之外,本发明采用的主要技术方案还包括:

一种应用于服务端的运维监控装置,该装置包括:资源监控管理模块、服务监控管
理模块、日志监控管理模块、认证安全管理模块、配置参数管理模块;

所述配置参数管理模块,用于存储资源监控配置、服务监控配置、日志监控配置和
认证安全监控配置;

所述资源监控配置包括所述服务端的性能指标、数量、服务进程指标和处理标识
映射;

所述服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接
口性能报文、服务监控结果、评估参数映射和异常处理策略;

所述日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处
理策略映射;

所述认证安全监控配置包括所述服务端应用服务负载指标阈值和操作映射;

所述资源监控管理模块,用于从所述配置参数管理模块中获取资源监控配置,根
据资源监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;

所述服务监控管理模块,用于从所述配置参数管理模块中获取服务监控配置,根
据服务监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;

所述日志监控管理模块,用于从所述配置参数管理模块中获取日志监控配置,根
据日志监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据;

所述认证安全管理模块,用于从所述配置参数管理模块中获取认证安全监控配
置,根据认证安全监控配置对所述服务端进行实时监控,存储监控操作记录和监控数据。

可选地,所述资源监控管理模块,用于根据所述资源监控配置获取所述服务端的
中央处理器CPU、内存、网络带宽、输入输出IO读写、磁盘空间、占据资源最大的前5位进程、
网络带宽占用;根据处理标识映射清除配置参数白名单外的CPU进程、内存进程、带宽进程、
IO读写进程、清除配置参数白名单外的目录磁盘空间;

所述服务监控管理模块,用于根据服务接口类别、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射,通过服务接口报文监控服务的正确性以及性能响应
数据;若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性;

所述日志监控管理模块,用于根据日志路径、日志类别、日志关键字、日志内容识
别确定日志是否异常;根据指引处理策略映射处理异常日志;

所述认证安全管理模块,用于根据所述服务端负载情况对比所述服务端应用服务
负载指标阈值,对新接入的网络之间互连的协议IP客服端优先级、频度进行分析;根据所述
操作映射处置所述新接入的IP客服端。

可选地,所述配置参数管理模块,用于存储综合阈值和对应处置映射;

所述装置还包括:综合控制管理模块;

所述综合控制管理模块,用于从所述配置参数管理模块中获取综合阈值和对应处
置映射;根据所述综合阈值评估存储的监控操作记录和监控数据;根据评估结果和对应处
置映射确定处置方案;根据所述处置方案分析处理所述存储的监控操作记录和监控数据;
存储处置操作记录和处置数据。

可选地,所述配置参数管理模块,用于存储通知方式、内容明细、频度、数据存储明
细标识、外置数据存储方式和监控操作记录的明细程度标识;

所述装置还包括:消息通知管理模块;

所述消息通知管理模块,用于从所述配置参数管理模块中获取通知方式、内容明
细、频度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标识;根据通
知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操作记录的明细程度
标识发送预警消息通知;存储预警操作记录和预警数据。

可选地,所述装置还包括:数据存储管理模块;

所述数据存储管理模块,用于管理资源监控管理模块、服务监控管理模块、日志监
控管理模块、认证安全管理模块存储的监控操作记录和监控数据,管理综合控制管理模块
存储的处置操作记录和处置数据,管理消息通知管理模块存储的预警操作记录和预警数
据。

(三)有益效果

本发明的有益效果是:根据资源监控配置、服务监控配置、日志监控配置和认证安
全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、服
务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口测
试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配置
包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策略映射;认证安全监控
配置包括服务端应用服务负载指标阈值和操作映射,在服务端出现问题前发现问题,避免
问题对服务端产生的影响。

附图说明

图1为本发明一个实施例提供的一种应用于服务端的运维监控方法流程图;

图2为本发明一个实施例提供的一种应用于服务端的运维监控装置结构示意图;

图3为本发明一个实施例提供的另一种应用于服务端的运维监控方法流程图;

图4为本发明一个实施例提供的另一种应用于服务端的运维监控方法流程图;

图5为本发明一个实施例提供的另一种应用于服务端的运维监控装置结构示意
图;

图6为本发明一个实施例提供的另一种应用于服务端的运维监控装置结构示意
图;

图7为本发明一个实施例提供的另一种应用于服务端的运维监控装置结构示意
图;

图8为本发明一个实施例提供的另一种应用于服务端的运维监控装置结构示意
图。

具体实施方式

为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发
明作详细描述。

服务端应用服务的正确性、稳定性、安全性、可靠性以及性能响应等将会是正常运
作的重要因素。当前服务端应用服务的管理技术水平不一,主要表现出管控技术单元碎片
化、管理人工化等。其中一些较为重要的服务端应用服务技术保障手段往往比较单一,主要
表现就是仅监控服务调用方面或仅监控应用服务中间件等,忽视了如服务应用本身资源参
数、服务端整体的资源参数、应用服务备份管理、本身应用服务提供与第三方调用以及日志
增长的正确性等,缺乏了对这些信息的过程分析与预警,出现问题之后的处理往往都是比
较滞后的与被动的;还有些对服务端的管理仅停留在人工管理阶段,服务端应用服务的正
常运作存在非常大的滞后隐患,都是在用户层面发现问题,导致影响广度与深度都有可能
达到不可控的地步,甚至有可能因为服务端应用服务的稳定性问题导致了该软件产品的生
命周期缩短,直接威胁该软件产品的生死存亡。

鉴于此,本发明提供一种应用于服务端的运维监控方法,根据资源监控配置、服务
监控配置、日志监控配置和认证安全监控配置对服务端进行实时监控,其中,资源监控配置
包括服务端的性能指标、数量、服务进程指标和处理标识映射;服务监控配置包括服务接口
类别、服务接口报文、服务接口测试列表、服务接口性能报文、服务监控结果、评估参数映射
和异常处理策略;日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指
引处理策略映射;认证安全监控配置包括服务端应用服务负载指标阈值和操作映射,在服
务端出现问题前发现问题,避免问题对服务端产生的影响。

另外,本发明提供的应用于服务端的运维监控方法可以根据对监控操作记录和监
控数据的评估结果采取相应的处置方法进行自动分析处理。

参见图1,本实施例提供的一种应用于服务端的运维监控方法,包括:

101,获取资源监控配置、服务监控配置、日志监控配置和认证安全监控配置。

资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映射。

服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射和异常处理策略。

日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策
略映射。

认证安全监控配置包括服务端应用服务负载指标阈值和操作映射。

102,根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对服
务端进行实时监控。

可选地,根据资源监控配置对服务端进行监控,包括:

根据资源监控配置获取服务端的CPU(Central Processing Unit,中央处理器)、
内存、网络带宽、IO(Input/Output,输入输出)读写、磁盘空间、占据资源最大的前5位(数量
可配置)进程、网络带宽占用。

根据处理标识映射清除配置参数白名单外的CPU进程、内存进程、带宽进程、IO读
写进程、清除配置参数白名单外的目录磁盘空间。

根据服务监控配置对服务端进行监控,包括:

根据服务接口类别、服务接口测试列表、服务接口性能报文、服务监控结果、评估
参数映射,通过服务接口报文监控服务的正确性以及性能响应数据。

若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性。

根据日志监控配置对服务端进行监控,包括:

根据日志路径、日志类别、日志关键字、日志内容识别确定日志是否异常。

根据指引处理策略映射处理异常日志。

根据认证安全监控配置对服务端进行监控,包括:

根据服务端负载情况对比服务端应用服务负载指标阈值,对新接入的网络之间互
连的协议IP客服端优先级、频度进行分析。

根据操作映射处置新接入的IP客服端。

可选地,通过如下公式计算任一进程占据资源,


Ri为进程i占据资源,为进程i实际占用资源,为各进程实际占用资源总
和,Rall为服务端额定资源。

获取占据资源最大的前5位(数量可配置)进程,包括:

获取预先设置的占据资源阈值;

获取大于占据资源阈值的最大的前5位(数量可配置)进程。

103,存储监控操作记录和监控数据。

可选地,步骤103执行之后,还包括:

104-1,获取综合阈值和对应处置映射。

104-2,根据综合阈值评估存储的监控操作记录和监控数据。

104-3,根据评估结果和对应处置映射确定处置方案。

104-4,根据处置方案分析处理存储的监控操作记录和监控数据。

104-5,存储处置操作记录和处置数据。

可选地,步骤103执行之后,还包括:

105-1,获取通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式和
监控操作记录的明细程度标识。

105-2,根据通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监
控操作记录的明细程度标识发送预警消息通知。

105-3,存储预警操作记录和预警数据。

本实施例的有益效果是:根据资源监控配置、服务监控配置、日志监控配置和认证
安全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、
服务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口
测试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配
置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策略映射;认证安全监
控配置包括服务端应用服务负载指标阈值和操作映射,在服务端出现问题前发现问题,避
免问题对服务端产生的影响。

另外,本发明提供的应用于服务端的运维监控方法可以根据对监控操作记录和监
控数据的评估结果采取相应的处置方法进行自动分析处理。

本发明提供的应用于服务端的运维监控方法应用于图2所示的应用于服务端的运
维监控装置中。

该应用于服务端的运维监控装置包括:资源监控管理模块201、服务监控管理模块
202、日志监控管理模块203、认证安全管理模块204、配置参数管理模块205、数据存储管理
模块206、综合控制管理模块207、消息通知管理模块208。

各个模块有序可控地连成一个有机整体,围绕保障服务端应用服务的正常运作的
目标,各个模块完成相互独立又相互关联任务。

其中,配置参数管理模块205,用于存储资源监控配置、服务监控配置、日志监控配
置、认证安全监控配置、综合阈值、对应处置映射、通知方式、内容明细、频度、数据存储明细
标识、外置数据存储方式和监控操作记录的明细程度标识等内容。完成把资源监控管理模
块201、服务监控配置模块202、日志监控配置模块203、认证安全监控配置模块204、数据存
储管理模块206、综合控制管理模块207、消息通知管理模块208七大模块的所有参数配置进
行序列化管理。

资源监控管理模块201,用于从配置参数管理模块205中获取资源监控配置,根据
资源监控配置完成服务端总体性能与服务应用的性能数据监控与管理;

服务监控管理模块202,用于从配置参数管理模块205中获取服务监控配置,根据
服务监控配置完成本身服务应用的服务提供以及服务第三方调用的正确性保障。

日志监控管理模块203,用于从配置参数管理模块205中获取日志监控配置,根据
日志监控配置完成服务端日志分析、服务应用日志分析,并根据配置参数采取相应的策略。

认证安全管理模块204,用于从配置参数管理模块205中获取认证安全监控配置,
根据认证安全监控配置完成根据服务端负载情况,对新接入的IP客服端(或浏览器)优先
级、频度进行分析与处置。

数据存储管理模块206,用于主要完成把资源监控管理模块201、服务监控配置
202、日志监控配置203、认证安全监控配置204、配置参数管理模块205、综合控制管理模块
207、消息通知管理模块208七大模块产出的数据进行结构化管理,以便于数据同步与流通。

综合控制管理模块207,用于把资源监控管理模块201、服务监控管理模块202、日
志监控管理模块203、认证安全管理模块204所产出的放在数据存储管理模块206中的数据
根据配置参数管理模块205中获取综合阈值和对应处置映射进行综合评估与处置。

消息通知管理模块208,用于从配置参数管理模块205中获取通知方式、内容明细、
频度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标识。根据通知方
式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操作记录的明细程度标识
发送预警消息通知,存储预警操作记录和预警数据。完成服务端的运维监控中需触发预警
消息通知的动作。

下面结合图2所示的服务端的运维监控装置,对本发明提供的服务端的运维监控
方法进行再次说明,参见图3。

301,获取资源监控配置、服务监控配置、日志监控配置和认证安全监控配置。

其中,资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映
射。

服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射和异常处理策略。

日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策
略映射。

认证安全监控配置包括服务端应用服务负载指标阈值和操作映射。

对于图2所示的应用于服务端的运维监控装置,由于配置参数管理模块205中存储
有资源监控配置、服务监控配置、日志监控配置和认证安全监控配置,因此,步骤301中资源
监控管理模块201从配置参数管理模块205中获取资源监控配置。服务监控管理模块202从
配置参数管理模块205中获取服务监控配置。日志监控管理模块203,从配置参数管理模块
205中获取日志监控配置。认证安全管理模块204,从配置参数管理模块205中获取认证安全
监控配置。

302,根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对服
务端进行实时监控。

1)根据资源监控配置对服务端进行监控的步骤通过如下子步骤实现。

子步骤1.1,根据资源监控配置获取服务端的中央处理器CPU、内存、网络带宽、输
入输出IO读写、磁盘空间、占据资源最大的前5位(数量可配置)进程、网络带宽占用。

考虑到进程除实际占用资源外,还会预留一些资源,因此,子步骤1.1可以通过如
下公式计算任一进程占据资源,


Ri为进程i占据资源,为进程i实际占用资源,为各进程实际占用资源总
和,Rall为服务端额定资源。

获取占据资源最大的前5位(数量可配置)进程,包括:

获取预先设置的占据资源阈值;

获取大于占据资源阈值的最大的前5位(数量可配置)进程。

子步骤1.2,根据处理标识映射清除配置参数白名单外的CPU进程、内存进程、带宽
进程、IO读写进程、清除配置参数白名单外的目录磁盘空间。

对于图2所示的应用于服务端的运维监控装置,资源监控管理模块201根据资源监
控配置对服务端进行实时监控,存储监控操作记录和监控数据。

具体的,资源监控管理模块201根据资源监控配置获取服务端的CPU、内存、网络带
宽、IO读写、磁盘空间、占据资源最大的前5位(数量可配置)进程、网络带宽占用。根据处理
标识映射清除配置参数白名单外的CPU进程、内存进程、带宽进程、IO读写进程、清除配置参
数白名单外的目录磁盘空间。

2)根据服务监控配置对服务端进行监控的步骤通过如下子步骤实现。

子步骤2.1,根据服务接口类别、服务接口测试列表、服务接口性能报文、服务监控
结果、评估参数映射,通过服务接口报文监控服务的正确性以及性能响应数据。

子步骤2.2,若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性
与正确性。

对于图2所示的应用于服务端的运维监控装置,服务监控管理模块202根据服务监
控配置对服务端进行实时监控,存储监控操作记录和监控数据。

具体的,服务监控管理模块202根据服务接口类别、服务接口测试列表、服务接口
性能报文、服务监控结果、评估参数映射,通过服务接口报文监控服务的正确性以及性能响
应数据。若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性。

3)根据日志监控配置对服务端进行监控的步骤通过如下子步骤实现。

子步骤3.1,根据日志路径、日志类别、日志关键字、日志内容识别确定日志是否异
常。

子步骤3.2,根据指引处理策略映射处理异常日志。

对于图2所示的应用于服务端的运维监控装置,日志监控管理模块203从配置参数
管理模块205中获取日志监控配置,根据日志监控配置对服务端进行实时监控,存储监控操
作记录和监控数据。

具体的,日志监控管理模块203根据日志路径、日志类别、日志关键字、日志内容识
别确定日志是否异常;根据指引处理策略映射处理异常日志。

4)根据认证安全监控配置对服务端进行监控的步骤通过如下子步骤实现。

子步骤4.1,根据服务端负载情况对比服务端应用服务负载指标阈值,对新接入的
网络之间互连的协议IP客服端优先级、频度进行分析。

子步骤4.2,根据操作映射处置新接入的IP客服端。

对于图2所示的应用于服务端的运维监控装置,认证安全管理模块204根据认证安
全监控配置对服务端进行实时监控,存储监控操作记录和监控数据。

具体的,认证安全管理模块204根据服务端负载情况对比服务端应用服务负载指
标阈值,对新接入的IP(Internet Protocol,网络之间互连的协议)客服端优先级、频度进
行分析。根据操作映射处置新接入的IP客服端。

303,存储监控操作记录和监控数据。

存储的监控操作记录和监控数据由数据存储管理模块206结构化管理。

执行步骤301至步骤303之后,还可以对步骤303中存储的监控操作记录和监控数
据进行分析。例如:

304-1,获取综合阈值和对应处置映射。

304-2,根据综合阈值评估存储的监控操作记录和监控数据。

304-3,根据评估结果和对应处置映射确定处置方案;

304-4,根据处置方案分析处理存储的监控操作记录和监控数据。

304-5,存储处置操作记录和处置数据。

对于图2所示的应用于服务端的运维监控装置,由于配置参数管理模块205中还存
储有综合阈值和对应处置映射。因此,综合控制管理模块207从配置参数管理模块205中获
取综合阈值和对应处置映射。根据综合阈值评估存储的监控操作记录和监控数据。根据评
估结果和对应处置映射处置存储的监控操作记录和监控数据。存储处置操作记录和处置数
据。存储的监控操作记录和监控数据由数据存储管理模块206结构化管理。

通过步骤104-3和步骤104-4可以根据对监控操作记录和监控数据的评估结果采
取相应的处置方法进行自动分析处理。例如,根据评估结果和对应处置映射确定处置方案
为任一白名单进程被其他非白名单进程影响程度大于30%,将该非白名单的占据资源较高
的进程删掉,从而保障白名单进程的正常运作;根据该处置方案分析处理存储的监控操作
记录和监控数据,当出现白名单进程A被其他非白名单进程影响程度为50%(或以上)时,将
对进程全程监管,对非白名单进程进行限制启动,以确保白名单进程正常运作。

除此之外,执行步骤301至步骤303之后,还可以预警,例如:

305-1,获取通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式和
监控操作记录的明细程度标识;

305-2,根据通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监
控操作记录的明细程度标识发送预警消息通知;

305-3,存储预警操作记录和预警数据。

对于图2所示的应用于服务端的运维监控装置,由于配置参数管理模块205中还存
储有通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式和监控操作记录的
明细程度标识。因此,消息通知管理模块208从配置参数管理模块205中获取通知方式、内容
明细、频度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标识。根据
通知方式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操作记录的明细程
度标识发送预警消息通知。存储预警操作记录和预警数据。

通过上述过程,实现了本发明提供的一种应用于服务端的运维监控方法,把服务
端应用服务正常运作的各种要素,包括正确性、稳定性、安全性、可靠性以及性能响应等纳
入统计的管理与控制,包括服务端的主机系统资源参数、服务应用本身资源参数、服务应用
提供服务调用、第三方服务调用、服务端操作系统日志分析、服务应用日志分析、新接入IP
监控与管理等。

对于图2所示的应用于服务端的运维监控装置,

1、资源监控管理模块201主要完成服务端主机的总体性能与应用服务进程的性能
数据监控与管理。根据配置参数管理模块205中的参数,可以监控主机操作总体性能指标,
包括CPU、内存、网络带宽、IO读写、磁盘空间、占据资源最大的前5位(数量可配置)进程。同
时可以监控单个与多个自定义进程的各种性能指标,包括CPU、内存、IO读写、网络带宽占用
等信息。

资源监控管理模块201负责性能数据采集、同步与根据数据处理标识(该标识值由
综合控制管理模块207综合各种情况多角度数据进行评估并赋值设置)进行相应的处理,例
如清除配置参数白名单外的占据资源(CPU、内存、带宽、IO读写)的进程、清除配置参数白名
单外的目录磁盘空间等。

把该过程所有资源数据与操作记录同步到数据库中由数据存储管理模块206管
理。

2、配置参数管理模块205主要完成把资源监控管理模块201、服务监控管理模块
202、日志监控管理模块203、认证安全管理模块204、综合控制管理模块207、消息通知管理
模块208、数据存储管理模块206的所有参数配置进行序列化管理。具体包括:1)资源监控管
理模块201中的主机操作系统监控各种性能指标、数量、自定义服务进程各种指标、评估结
果阈值与处理标识映射等信息。2)日志监控管理模块203中的日志路径、日志类别、日志关
键字、日志内容识别与指引处理策略映射等。3)服务监控管理模块202中的服务接口类别、
服务接口报文、服务接口测试列表、服务接口性能报文、服务监控结果、评估参数映射以及
异常处理策略等。4)认证安全管理模块204中的服务端应用服务负载指标阈值与操作映射
(新增接入IP地址控制与频繁接入IP地址控制)。5)综合控制管理模块207中的综合总体所
有数据采集监控模块中的综合阈值与对应处置映射;消息通知管理模块208中通知方式、内
容明细以及频度(实时、定时)等。6)数据存储管理模块206中的数据存储明细标识、外置数
据存储方式(数据库、文档)、所有操作过程的明细程度标识。

3、认证安全管理模块204根据服务端负载情况对比配置参数管理模块205中的阈
值,对新接入的IP客服端(或浏览器)优先级、频度进行分析与处置(拦截),以保障能提供给
现存接入的客户端(或浏览器)正常服务,避免加剧服务端应用服务的负责,从而避免引发
更大的范围的影响,把该过程的所有数据与操作记录同步到数据库由数据存储管理模块
206管理。

4、服务监控管理模块202主要完成本身服务应用的服务提供以及服务第三方调用
的正确性保障。通过接口报文调用(应用服务与第三方服务)监控服务的正确性以及性能响
应数据;若发生异常,会根据配置参数中的参数检查对应的进程启动运行的完整性与正确
性;把过程检测的所有数据以及操作记录同步到数据库由数据存储管理模块206管理。

5、日志监控管理模块203完成操作系统日志分析、服务应用日志分析。针对日志情
况(正常与异常)根据配置参数的策略采取相应的措施并存储至数据库由数据存储管理模
块206管理。

6、数据存储管理模块206把资源监控管理模块201、服务监控管理模块202、日志监
控管理模块203、认证安全管理模块204、配置参数管理模块205、综合控制管理模块207与消
息通知管理模块208产出的数据进行结构化序列化管理,包括数据初始化、过程同步与传
输。根据配置参数标识数据存储明细、外置数据存储方式(数据库、文档);同时包括整个过
程操作过程的记录存储。

7、综合控制管理模块207主要完成把资源监控管理模块201、服务监控管理模块
202、日志监控管理模块203、认证安全管理模块204所产出的由数据存储管理模块206管理
的数据,根据配置参数管理模块205模块进行综合评估与处置。把具体处理结果标识同步到
数据存储管理模块206中,以便让各个模块采取相应的处理。

8、消息通知管理模块208主要完成数据存储管理模块206中需触发预警消息通知
的动作。具体通知方式有邮件发送模块与短信触发接口模块;消息格式、内容、时间(实时、
定时)根据配置参数标识自动适配与执行。

其中资源监控管理模块201、认证安全管理模块204、日志监控管理模块203、服务
监控管理模块202属于行为模块,它们监控的动作是异步实时运行的,它们每个行为模块都
有各自的适配器去灵活适配不同的对象与类型。配置参数管理模块205、数据存储管理模块
206及外置数据存储、综合控制管理模块207、消息通知管理模块208属于管理模块,它们的
管理动作同步实时的(依赖于行为模块的数据)。

上述模块之间的交互可参见图4,图4所示的交互顺序可互换,本实施例并不限定。

本实施例提供的应用于服务端的运维监控方法,通过把服务端上所有影响应用服
务稳定因素都全部纳入实时监控与管控范围,逐项分析、处理与预警,从服务端主机资源、
操作系统性能指标与日志到应用服务性能与日志、应用服务调用提供以及应用服务接入服
务安全等各个方面都做了全方位的数据采集与分析,得出综合评估结果后再根据配置参数
采取了相应的处置办法,从而提前预知服务端应用服务的稳定运作的隐患并采取相应的措
施,进而保障了服务端应用服务的稳定持续正常运作。

本实施例提供的应用于服务端的运维监控方法相对于现有技术有如下优势:

1、具有高度灵活配置化,包括全过程的数据采集并分析、评估与处置全部实现配
置化。

2、具有无需人值守全自动化,采集、分析、处置与消息通知等全过程实现全自动
化。

3、具有高度复用性,不同的服务端、操作系统、应用服务、日志等都有专门的适配
器。

4、通过配置可实现主机、操作系统、进程不同类型、多种维度的数据采集。

5、通过配置可实现应用服务不同接口调用的正确性、稳定性、性能指标检查。

6、通过配置可实现第三方服务不同接口调用的正确性、稳定性、性能指标检查。

7、通过配置可实现操作系统日志、应用服务日志的自动分析与消息通知。

8、通过配置可实现根据服务负载情况管控接入客服端(或浏览器)广度与频度。

9、通过配置可实现消息通知信息的明细程度、消息方式(邮件与短信)。

10、可以根据对监控操作记录和监控数据的评估结果采取相应的处置方法进行自
动分析处理。

本实施例的有益效果是:根据资源监控配置、服务监控配置、日志监控配置和认证
安全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、
服务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口
测试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配
置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策略映射;认证安全监
控配置包括服务端应用服务负载指标阈值和操作映射,在服务端出现问题前发现问题,避
免问题对服务端产生的影响。

另外,本发明提供的应用于服务端的运维监控方法可以根据对监控操作记录和监
控数据的评估结果采取相应的处置方法进行自动分析处理。

基于同一发明构思,本发明还提供一种应用于服务端的运维监控装置,该装置解
决问题的原理与应用于服务端的运维监控方法相似,因此该装置的实施可以参见一种应用
于服务端的运维监控方法的实施,重复之处不再赘述。

参见图5,该应用于服务端的运维监控装置,包括:资源监控管理模块501、服务监
控管理模块502、日志监控管理模块503、认证安全管理模块504、配置参数管理模块505。

配置参数管理模块505,用于存储资源监控配置、服务监控配置、日志监控配置和
认证安全监控配置;

资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映射;

服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射和异常处理策略;

日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策
略映射;

认证安全监控配置包括服务端应用服务负载指标阈值和操作映射;

资源监控管理模块501,用于从配置参数管理模块505中获取资源监控配置,根据
资源监控配置对服务端进行实时监控,存储监控操作记录和监控数据;

服务监控管理模块502,用于从配置参数管理模块505中获取服务监控配置,根据
服务监控配置对服务端进行实时监控,存储监控操作记录和监控数据;

日志监控管理模块503,用于从配置参数管理模块505中获取日志监控配置,根据
日志监控配置对服务端进行实时监控,存储监控操作记录和监控数据;

认证安全管理模块504,用于从配置参数管理模块505中获取认证安全监控配置,
根据认证安全监控配置对服务端进行实时监控,存储监控操作记录和监控数据。

可选地,资源监控管理模块501,用于根据资源监控配置获取服务端的CPU、内存、
网络带宽、IO读写、磁盘空间、占据资源最大的前5位进程、网络带宽占用;根据处理标识映
射清除配置参数白名单外的CPU进程、内存进程、带宽进程、IO读写进程、清除配置参数白名
单外的目录磁盘空间;

服务监控管理模块502,用于根据服务接口类别、服务接口测试列表、服务接口性
能报文、服务监控结果、评估参数映射,通过服务接口报文监控服务的正确性以及性能响应
数据;若发生异常,会根据异常处理策略检查对应的进程启动运行的完整性与正确性;

日志监控管理模块503,用于根据日志路径、日志类别、日志关键字、日志内容识别
确定日志是否异常;根据指引处理策略映射处理异常日志;

认证安全管理模块504,用于根据服务端负载情况对比服务端应用服务负载指标
阈值,对新接入的网络之间互连的协议IP客服端优先级、频度进行分析;根据操作映射处置
新接入的IP客服端。

参见图6,配置参数管理模块505,用于存储综合阈值和对应处置映射;

该装置还包括:综合控制管理模块506。

综合控制管理模块506,用于从配置参数管理模块505中获取综合阈值和对应处置
映射;根据综合阈值评估存储的监控操作记录和监控数据;根据评估结果和对应处置映射
确定处置方案;根据处置方案分析处理存储的监控操作记录和监控数据;存储处置操作记
录和处置数据。

参见图7,配置参数管理模块505,用于存储通知方式、内容明细、频度、数据存储明
细标识、外置数据存储方式和监控操作记录的明细程度标识;

该装置还包括:消息通知管理模块507。

消息通知管理模块507,用于从配置参数管理模块505中获取通知方式、内容明细、
频度、数据存储明细标识、外置数据存储方式和监控操作记录的明细程度标识;根据通知方
式、内容明细、频度、数据存储明细标识、外置数据存储方式、监控操作记录的明细程度标识
发送预警消息通知;存储预警操作记录和预警数据。

参见图8,该装置还包括:数据存储管理模块508。

数据存储管理模块508,用于管理资源监控管理模块501、服务监控管理模块502、
日志监控管理模块503、认证安全管理模块504存储的监控操作记录和监控数据,管理综合
控制管理模块506存储的处置操作记录和处置数据,管理消息通知管理模块507存储的预警
操作记录和预警数据。

本实施例的有益效果是:根据资源监控配置、服务监控配置、日志监控配置和认证
安全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、
服务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口
测试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配
置包括日志路径、日志类别、日志关键字、日志内容识别和指引处理策略映射;认证安全监
控配置包括服务端应用服务负载指标阈值和操作映射,在服务端出现问题前发现问题,避
免问题对服务端产生的影响。

另外,本发明提供的应用于服务端的运维监控方法可以根据对监控操作记录和监
控数据的评估结果采取相应的处置方法进行自动分析处理。

一种应用于服务端的运维监控方法和装置.pdf_第1页
第1页 / 共22页
一种应用于服务端的运维监控方法和装置.pdf_第2页
第2页 / 共22页
一种应用于服务端的运维监控方法和装置.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《一种应用于服务端的运维监控方法和装置.pdf》由会员分享,可在线阅读,更多相关《一种应用于服务端的运维监控方法和装置.pdf(22页珍藏版)》请在专利查询网上搜索。

本发明涉及一种应用于服务端的运维监控方法与装置。该方法包括:根据资源监控配置、服务监控配置、日志监控配置和认证安全监控配置对服务端进行实时监控,其中,资源监控配置包括服务端的性能指标、数量、服务进程指标和处理标识映射;服务监控配置包括服务接口类别、服务接口报文、服务接口测试列表、服务接口性能报文、服务监控结果、评估参数映射和异常处理策略;日志监控配置包括日志路径、日志类别、日志关键字、日志内容识别。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1