《云虚拟网关的健康度评估方法、系统、设备和存储介质.pdf》由会员分享,可在线阅读,更多相关《云虚拟网关的健康度评估方法、系统、设备和存储介质.pdf(21页珍藏版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010846822.7 (22)申请日 2020.08.21 (71)申请人 中国建设银行股份有限公司 地址 100032 北京市西城区金融大街25号 (72)发明人 王蓓魏宇涛丁利锋 (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 郝传鑫 (51)Int.Cl. G06Q 10/06(2012.01) G06F 30/27(2020.01) G06F 17/18(2006.01) H04L 12/26(2006.01) H04L 12/66(20。
2、06.01) (54)发明名称 云虚拟网关的健康度评估方法、 系统、 设备 和存储介质 (57)摘要 本公开提供了一种云虚拟网关的运行健康 度评估方法、 系统、 设备和存储介质。 所述评估方 法包括: 基于待评估云虚拟网关的历史运行健康 指标获取样本集; 利用预处理后的样本集数据对 建立的运行健康度评估模型进行参数值训练和 调整, 及模型测试; 将待评估云虚拟网关的当前 监控指标作为该模型的输入值; 则该模型的输出 值为待评估云虚拟网关的运行健康度的评估值。 本公开提供的评估方法根据历史运行健康指标 得到的样本集数据获得运行健康度评估模型, 并 基于该模型和当前监控指标得到健康度评估值, 即待。
3、评估云虚拟网关当前或未来一段时间内运 行健康的概率, 进而在运行健康概率低时提醒运 维人员排查处理, 防止故障发生, 可以有效提高 网络运维的效率和质量。 权利要求书4页 说明书13页 附图3页 CN 112001622 A 2020.11.27 CN 112001622 A 1.一种云虚拟网关的运行健康度评估方法, 其特征在于, 所述评估方法包括: 采集待评估云虚拟网关的历史运行健康指标; 基于所述历史运行健康指标获取样本集; 对所述样本集进行预处理, 并将预处理后的样本集中的数据分为训练数据、 验证数据、 测试数据; 采用回归预测算法建立所述待评估云虚拟网关的运行健康度评估模型, 并利用所。
4、述训 练数据训练所述运行健康度评估模型的参数值, 利用所述验证数据调整所述参数值, 利用 所述测试数据测试所述运行健康度评估模型的效果; 将实时采集的所述待评估云虚拟网关的当前监控指标作为当前输入值发送至所述运 行健康度评估模型; 获取所述运行健康度评估模型的输出值作为所述待评估云虚拟网关的当前或未来一 段时间运行健康度的评估值。 2.如权利要求1所述的评估方法, 其特征在于, 所述历史运行健康指标包括: 所述待评估云虚拟网关的历史监控指标值、 历史属性值、 历史故障情况; 所述待评估云虚拟网关所在的物理服务器的历史监控指标值、 历史属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网。
5、关的历史监控指标值、 历史 属性值、 历史故障情况。 3.如权利要求2所述的评估方法, 其特征在于, 所述待评估云虚拟网关的历史监控指标值包括: 所述待评估云虚拟网关的平均每秒出 流量、 平均每秒入流量、 平均每秒出包量、 平均每秒入包量, 以及所述待评估云虚拟网关的 并发连接数; 所述待评估云虚拟网关的历史属性值包括: 所述待评估云虚拟网关本身的带宽、 所述 待评估云虚拟网关本身的并发连接数上限; 所述待评估云虚拟网关的历史故障情况包括: 网络是否连通、 是否丢包; 所述待评估云虚拟网关所在的物理服务器的历史监控指标值包括: CPU利用率、 内存利 用率、 I/O繁忙程度、 网络连通性、 网。
6、卡的出流量、 网卡的入流量、 网卡的丢包数; 所述待评估云虚拟网关所在的物理服务器的历史属性值包括: 网卡的带宽、 所述待评 估云虚拟网关所在的物理服务器可承担的并发连接数上限、 所述待评估云虚拟网关所在的 物理服务器上云虚拟网关的数量; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值包括: 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的平均每秒出流量、 平均每秒 入流量、 平均每秒出包量、 平均每秒入包量, 以及所述待评估云虚拟网关所在的物理服务器 上其他云虚拟网关的并发连接数; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史属性值包括: 所述 待评。
7、估云虚拟网关所在的物理服务器上其他云虚拟网关本身的带宽、 所述待评估云虚拟网 关所在的物理服务器上其他云虚拟网关本身的并发连接数上限; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史故障情况包括: 网 络是否连通、 是否丢包。 4.如权利要求3所述的评估方法, 其特征在于, 基于所述历史运行健康指标获取样本集 权利要求书 1/4 页 2 CN 112001622 A 2 包括: 将所述待评估云虚拟网关的历史监控指标值、 历史属性值, 所述待评估云虚拟网关所 在的物理服务器上其他云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚 拟网关所在的物理服务器的历史监控指标值、 。
8、历史属性值作为输入值; 将所述待评估云虚拟网关的历史故障情况、 所述待评估云虚拟网关所在的物理服务器 上其他云虚拟网关的历史故障情况作为目标值; 将所述输入值和所述目标值进行拼接, 得到所述样本集。 5.如权利要求4所述的评估方法, 其特征在于, 所述预处理包括: 去噪、 归一化处理。 6.如权利要求5所述的评估方法, 其特征在于, 采用回归预测算法建立所述待评估云虚 拟网关的运行健康度评估模型包括: 基于所述待评估云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟 网关所在的物理服务器的历史监控指标值、 历史属性值按照逻辑回归算法计算所述待评估 云虚拟网关的健康度基础分数; 基。
9、于所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟网关所在的物理服务器的历史监控指标值、 历史属性 值按照逻辑回归算法计算所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的 健康度基础分数; 获取所述待评估云虚拟网关和所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关对健康度的影响力权重参数; 基于所述待评估云虚拟网关的健康度基础分数、 所述待评估云虚拟网关所在的物理服 务器上其他云虚拟网关的健康度基础分数、 所述影响力权重参数确定所述运行健康度评估 模型的参数值。 7.如权利要求6所述的评估方法, 其特征在于, 利用所述训练数。
10、据训练所述运行健康度 评估模型的参数值包括: 利用所述训练数据获取基于不同参数值的所述运行健康度评估模型的预测输出值; 利用损失函数计算所有基于所述训练数据得到的预测输出值与所述训练数据中的实 际输出值之间的偏差之和; 采用梯度下降的方法求解所述偏差之和的最小值及其对应的参数值。 8.如权利要求1所述的评估方法, 其特征在于, 所述当前监控指标包括: 所述待评估云虚拟网关的当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器的当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的当前监控指标值、 当前 属性值、 当前故障情况。 9.如权利要求1所。
11、述的评估方法, 其特征在于, 采集所述待评估云虚拟网关的历史运行 健康指标包括: 基于分布式的海量日志采集、 聚合和传输的系统Flume采集所述待评估云虚拟网关的 历史运行健康指标。 10.一种云虚拟网关的运行健康度评估系统, 其特征在于, 所述评估系统包括: 历史指标获取模块, 用于采集待评估云虚拟网关的历史运行健康指标; 权利要求书 2/4 页 3 CN 112001622 A 3 样本获取模块, 用于基于所述历史运行健康指标获取样本集; 预处理模块, 用于对所述样本集进行预处理, 并将预处理后的样本集中的数据分为训 练数据、 验证数据、 测试数据; 模型建立模块, 用于采用回归预测算法建。
12、立所述待评估云虚拟网关的运行健康度评估 模型, 并利用所述训练数据训练所述运行健康度评估模型的参数值, 利用所述验证数据调 整所述参数值, 利用所述测试数据测试所述运行健康度评估模型的效果; 评估模块, 用于将实时采集的所述待评估云虚拟网关的当前监控指标作为当前输入值 发送至所述运行健康度评估模型, 获取所述运行健康度评估模型的输出值作为所述待评估 云虚拟网关的当前或未来一段时间运行健康度的评估值。 11.如权利要求9所述的评估系统, 其特征在于, 所述历史运行健康指标包括: 所述待评估云虚拟网关的历史监控指标值、 历史属性值、 历史故障情况; 所述待评估云虚拟网关所在的物理服务器的历史监控指。
13、标值、 历史属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值、 历史 属性值、 历史故障情况。 12.如权利要求10所述的评估系统, 其特征在于, 所述待评估云虚拟网关的历史监控指标值包括: 所述待评估云虚拟网关的平均每秒出 流量、 平均每秒入流量、 平均每秒出包量、 平均每秒入包量, 以及所述待评估云虚拟网关的 并发连接数; 所述待评估云虚拟网关的历史属性值包括: 所述待评估云虚拟网关本身的带宽、 所述 待评估云虚拟网关本身的并发连接数上限; 所述待评估云虚拟网关的历史故障情况包括: 网络是否连通、 是否丢包; 所述待评估云虚拟网关所在的物理服务器的历史监控指标。
14、值包括: CPU利用率、 内存利 用率、 I/O繁忙程度、 网络连通性、 网卡的出流量、 网卡的入流量、 网卡的丢包数; 所述待评估云虚拟网关所在的物理服务器的历史属性值包括: 网卡的带宽、 所述待评 估云虚拟网关所在的物理服务器可承担的并发连接数上限、 所述待评估云虚拟网关所在的 物理服务器上云虚拟网关的数量; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值包括: 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的平均每秒出流量、 平均每秒 入流量、 平均每秒出包量、 平均每秒入包量, 以及所述待评估云虚拟网关所在的物理服务器 上其他云虚拟网关的并发连接数; 所述待。
15、评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史属性值包括: 所述 待评估云虚拟网关所在的物理服务器上其他云虚拟网关本身的带宽、 所述待评估云虚拟网 关所在的物理服务器上其他云虚拟网关本身的并发连接数上限; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史故障情况包括: 网 络是否连通、 是否丢包。 13.如权利要求11所述的评估系统, 其特征在于, 基于所述历史运行健康指标获取样本 集包括: 将所述待评估云虚拟网关的历史监控指标值、 历史属性值, 所述待评估云虚拟网关所 在的物理服务器上其他云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚 权利要求书 3/4 页 。
16、4 CN 112001622 A 4 拟网关所在的物理服务器的历史监控指标值、 历史属性值作为输入值; 将所述待评估云虚拟网关的历史故障情况、 所述待评估云虚拟网关所在的物理服务器 上其他云虚拟网关的历史故障情况作为目标值; 将所述输入值和所述目标值进行拼接, 得到所述样本集。 14.如权利要求12所述的评估系统, 其特征在于, 所述预处理包括: 去噪、 归一化处理。 15.如权利要求13所述的评估系统, 其特征在于, 采用回归预测算法建立所述待评估云 虚拟网关的运行健康度评估模型包括: 基于所述待评估云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟 网关所在的物理服务器的历史。
17、监控指标值、 历史属性值按照逻辑回归算法计算所述待评估 云虚拟网关的健康度基础分数; 基于所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟网关所在的物理服务器的历史监控指标值、 历史属性 值按照逻辑回归算法计算所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的 健康度基础分数; 获取所述待评估云虚拟网关和所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关对健康度的影响力权重参数; 基于所述待评估云虚拟网关的健康度基础分数、 所述待评估云虚拟网关所在的物理服 务器上其他云虚拟网关的健康度基础分数、 所述影响力权重参数确定所述运行健。
18、康度评估 模型的参数值。 16.如权利要求15所述的评估系统, 其特征在于, 利用所述训练数据训练所述运行健康 度评估模型的参数值包括: 利用所述训练数据获取基于不同参数值的所述运行健康度评估模型的预测输出值; 利用损失函数计算所有基于所述训练数据得到的预测输出值与所述训练数据中的实 际输出值之间的偏差之和; 采用梯度下降的方法求解所述偏差之和的最小值及其对应的参数值。 17.如权利要求10所述的评估系统, 其特征在于, 所述当前监控指标包括: 所述待评估云虚拟网关的当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器的当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的。
19、物理服务器上其他云虚拟网关的当前监控指标值、 当前 属性值、 当前故障情况。 18.如权利要求10所述的评估系统, 其特征在于, 采集所述待评估云虚拟网关的历史运 行健康指标包括: 基于分布式的海量日志采集、 聚合和传输的系统Flume采集所述待评估云虚拟网关的 历史运行健康指标。 19.一种计算机存储介质, 所述计算机存储介质储存计算机软件指令, 其特征在于, 所 述计算机软件指令由处理器执行以实现如权利要求1-9中任一项所述的评估方法。 20.一种计算机设备, 其包括存储器和处理器; 其特征在于, 所述存储器用于存储一条或多条计算机指令, 所述处理器执行所述一条 或多条计算机指令以实现如权。
20、利要求1-9中任一项所述的评估方法。 权利要求书 4/4 页 5 CN 112001622 A 5 云虚拟网关的健康度评估方法、 系统、 设备和存储介质 技术领域 0001 本发明涉及计算机应用技术领域, 更为具体而言, 涉及一种云虚拟网关的运行健 康度评估方法、 系统、 设备和存储介质。 背景技术 0002 随着云计算市场规模的不断增大, 支撑各种云服务运行的网络面临的压力以及出 现故障的机率也不断增大, 给网络运维带来了巨大挑战, 如何有效提升网络运维的效率和 质量这个问题亟待解决。 云虚拟网关是云计算网络架构中非常重要的组件, 用户可以根据 自己的需求, 通过NAT(Network Ad。
21、dress Translation, 网络地址转换)网关、 VPN(Virtual Private Network, 虚拟专用网络)网关、 专线网关等各种云虚拟网关产品, 搭建自己的云上 网络环境, 云服务的运行状态和许多网络故障都和云虚拟网关的运行状态有着关联, 因此 评估云虚拟网关运行健康度有着非常重要的意义, 能够在一定程度上预警云服务的运行状 态和云数据中心的网络故障, 从而提升网络运维的效率和质量。 0003 然而, 针对云虚拟网关的运行健康度的评估, 目前主要依赖于运维人员的经验来 选择一些关键指标例如外网出带宽、 外网入带宽、 出包量、 入包量、 连通状态、 并发连接数等 关键指。
22、标进行综合分析判断, 但是这种方式存在三大问题: 第一, 云计算网络架构非常复 杂, 多个云虚拟网关可能被同一个物理服务器所承载, 它们相互之间也存在关联, 目前的人 工分析方式只考虑了云虚拟网关本身的指标, 而没有考虑与该云虚拟网关同在一个物理服 务器上的其他云虚拟网关对自己运行健康度的影响, 由此评估的云虚拟网关的健康度是不 够准确的; 第二, 人工分析的方式难以捕捉到各个监控指标之间复杂的关联关系, 无法给出 准确的评估; 第三, 云计算平台上的每个租户都至少有一个云虚拟网关, 云虚拟网关的规模 巨大, 远远超过了传统数据中心的网关服务器的数量, 依靠人工评估云虚拟网关的运行健 康度需要。
23、耗费巨大的人力资源和时间。 此外, 云虚拟网关的运行健康度也难以由人工经验 从当前对物理服务器的几个监控指标总结出规则。 0004 可见, 目前依赖网络运维工程师的人工经验对有限的、 关键的监控指标进行综合 分析来评估虚拟网关当前的运行健康度的方法, 无法分析出各个监控指标之间复杂的关联 关系, 且人工分析评估很难找到普适的、 完整的规律以及未来运行状态相关的潜在的问题。 发明内容 0005 为解决上述现有技术存在的问题或部分问题, 本发明实施方式提供了一种云虚拟 网关的运行健康度评估方法、 系统、 设备和存储介质, 基于历史运行健康度指标获取的样本 集数据得到运行健康度评估模型, 并将当前监。
24、控指标作为该运行健康度评估模型的输入, 以获取待评估云虚拟网关当前以及未来一段时间内的运行健康度的评估值, 进而在运行健 康度的评估值较低时及时提醒运维人员进行排查处理, 避免云虚拟网关的故障。 0006 根据本发明的第一方面, 本发明实施方式提供了一种云虚拟网关的运行健康度评 估方法, 包括: 采集待评估云虚拟网关的历史运行健康指标; 基于所述历史运行健康指标获 说明书 1/13 页 6 CN 112001622 A 6 取样本集; 对所述样本集进行预处理, 并将预处理后的样本集中的数据分为训练数据、 验证 数据、 测试数据; 采用回归预测算法建立所述待评估云虚拟网关的运行健康度评估模型, 。
25、并 利用所述训练数据训练所述运行健康度评估模型的参数值, 利用所述验证数据调整所述参 数值, 利用所述测试数据测试所述运行健康度评估模型的效果; 将实时采集的所述待评估 云虚拟网关的当前监控指标作为当前输入值发送至所述运行健康度评估模型; 获取所述运 行健康度评估模型的输出值作为所述待评估云虚拟网关的当前或未来一段时间运行健康 度的评估值。 0007 本发明上述实施方式基于历史运行健康度指标获取的样本集数据对建立的运行 健康度评估模型进行参数值训练、 调整及模型测试, 以得到较为准确的运行健康度评估模 型, 并将当前监控指标作为该运行健康度评估模型的输入, 以获取待评估云虚拟网关当前 或未来一。
26、段时间内的运行健康度的评估值, 进而在运行健康度的评估值较低时及时提醒运 维人员主动、 提早进行排查处理, 避免云虚拟网关的故障对云上业务造成可感知的影响, 从 而在一定程度上有效地提高网络运维的效率和质量, 为用户提供低成本、 高效率和高质量 的网络服务。 0008 在本发明的一些实施方式中, 所述历史运行健康指标包括: 所述待评估云虚拟网 关的历史监控指标值、 历史属性值、 历史故障情况; 所述待评估云虚拟网关所在的物理服务 器的历史监控指标值、 历史属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关的历史监控指标值、 历史属性值、 历史故障情况。 0009 在本发明的一些实。
27、施方式中, 所述待评估云虚拟网关的历史监控指标值包括: 所 述待评估云虚拟网关的平均每秒出流量、 平均每秒入流量、 平均每秒出包量、 平均每秒入包 量, 以及所述待评估云虚拟网关的并发连接数; 所述待评估云虚拟网关的历史属性值包括: 所述待评估云虚拟网关本身的带宽、 所述待评估云虚拟网关本身的并发连接数上限; 所述 待评估云虚拟网关的历史故障情况包括: 网络是否连通、 是否丢包; 所述待评估云虚拟网关 所在的物理服务器的历史监控指标值包括: CPU利用率、 内存利用率、 I/O繁忙程度、 网络连 通性、 网卡的出流量、 网卡的入流量、 网卡的丢包数; 所述待评估云虚拟网关所在的物理服 务器的历。
28、史属性值包括: 网卡的带宽、 所述待评估云虚拟网关所在的物理服务器可承担的 并发连接数上限、 所述待评估云虚拟网关所在的物理服务器上云虚拟网关的数量; 所述待 评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值包括: 所述待评估 云虚拟网关所在的物理服务器上其他云虚拟网关的平均每秒出流量、 平均每秒入流量、 平 均每秒出包量、 平均每秒入包量, 以及所述待评估云虚拟网关所在的物理服务器上其他云 虚拟网关的并发连接数; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历 史属性值包括: 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关本身的带宽、 所述待评估云虚拟网关所在的。
29、物理服务器上其他云虚拟网关本身的并发连接数上限; 所述 待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史故障情况包括: 网络是否连 通、 是否丢包。 0010 在本发明的一些实施方式中, 基于所述历史运行健康指标获取样本集包括: 将所 述待评估云虚拟网关的历史监控指标值、 历史属性值, 所述待评估云虚拟网关所在的物理 服务器上其他云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟网关所 在的物理服务器的历史监控指标值、 历史属性值作为输入值; 将所述待评估云虚拟网关的 说明书 2/13 页 7 CN 112001622 A 7 历史故障情况、 所述待评估云虚拟网关所在的物理。
30、服务器上其他云虚拟网关的历史故障情 况作为目标值; 将所述输入值和所述目标值进行拼接, 得到所述样本集。 0011 本发明上述实施方式通过处理待评估云虚拟网关、 与待评估云虚拟网关同在一个 物理服务器上的其他云虚拟网关的相关历史指标数据得到样本集, 使得基于这样的样本集 得到的运行健康度评估模型全面考虑到同一物理服务器上的其他云虚拟网关与待评估云 虚拟网关之间的关联关系, 以及它们对待评估云虚拟网关的运行健康度的影响, 进而得到 更加准确的运行健康度的评估值。 0012 在本发明的一些实施方式中, 所述预处理包括: 去噪、 归一化处理。 0013 本发明上述实施方式通过对样本集进行去噪、 归一。
31、化的预处理, 可以提高基于样 本集建立的运行健康度评估模型的准确性。 0014 在本发明的一些实施方式中, 采用回归预测算法建立所述待评估云虚拟网关的运 行健康度评估模型包括: 基于所述待评估云虚拟网关的历史监控指标值、 历史属性值, 以及 所述待评估云虚拟网关所在的物理服务器的历史监控指标值、 历史属性值获取所述待评估 云虚拟网关的健康度基础分数; 基于所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟网关所在的物理服务器的 历史监控指标值、 历史属性值获取所述待评估云虚拟网关所在的物理服务器上其他云虚拟 网关的健康度基础分数; 获取。
32、所述待评估云虚拟网关和所述待评估云虚拟网关所在的物理 服务器上其他云虚拟网关对健康度的影响力权重参数; 基于所述待评估云虚拟网关的健康 度基础分数、 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的健康度基础分 数、 所述影响力权重参数确定所述运行健康度评估模型的参数值。 0015 本发明上述实施方式通过考虑与待评估云虚拟网关同在一个物理服务器上的其 他云虚拟网关对待评估云虚拟网关的运行健康度的影响, 能够获取更加准确的运行健康度 评估模型, 进而得到更加准确的运行健康度的评估值。 0016 在本发明的一些实施方式中, 利用所述训练数据训练所述运行健康度评估模型的 参数值包括: 利用所述。
33、训练数据获取基于不同参数值的所述运行健康度评估模型的预测输 出值; 利用损失函数计算所有基于所述训练数据得到的预测输出值与所述训练数据中的实 际输出值之间的偏差之和; 采用梯度下降的方法求解所述偏差之和的最小值及其对应的参 数值。 本发明上述实施方式通过获取运行健康度评估模型的预测输出值与训练数据中的实 际输出值之间的偏差之和的最小值对应的参数值, 使得基于该参数值的运行健康度评估模 型更加准确, 从而获取更加准确的运行健康度的评估值。 0017 在本发明的一些实施方式中, 所述当前监控指标包括: 所述待评估云虚拟网关的 当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器的当。
34、前监控指标 值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的当前监控 指标值、 当前属性值、 当前故障情况。 0018 在本发明的一些实施方式中, 采集所述待评估云虚拟网关的历史运行健康指标包 括: 基于分布式的海量日志采集、 聚合和传输的系统Flume采集所述待评估云虚拟网关的历 史运行健康指标。 0019 根据本发明的第二方面, 本发明实施方式提供了一种云虚拟网关的运行健康度评 估系统, 包括: 历史指标获取模块, 用于采集待评估云虚拟网关的历史运行健康指标; 样本 说明书 3/13 页 8 CN 112001622 A 8 获取模块, 用于基于所述历史运行健康指。
35、标获取样本集; 预处理模块, 用于对所述样本集进 行预处理, 并将预处理后的样本集中的数据分为训练数据、 验证数据、 测试数据; 模型建立 模块, 用于采用回归预测算法建立所述待评估云虚拟网关的运行健康度评估模型, 并利用 所述训练数据训练所述运行健康度评估模型的参数值, 利用所述验证数据调整所述参数 值, 利用所述测试数据测试所述运行健康度评估模型的效果; 评估模块, 用于将实时采集的 所述待评估云虚拟网关的当前监控指标作为当前输入值发送至所述运行健康度评估模型, 获取所述运行健康度评估模型的输出值作为所述待评估云虚拟网关的当前或未来一段时 间运行健康度的评估值。 0020 本发明上述实施方。
36、式基于历史运行健康度指标获取的样本集数据对建立的运行 健康度评估模型进行参数值训练、 调整及模型测试, 以得到较为准确的运行健康度评估模 型, 并将当前监控指标作为该运行健康度评估模型的输入, 以获取待评估云虚拟网关当前 或未来一段时间内的运行健康度的评估值, 进而在运行健康度的评估值较低时及时提醒运 维人员主动、 提早进行排查处理, 避免云虚拟网关的故障对云上业务造成可感知的影响, 从 而在一定程度上有效地提高网络运维的效率和质量, 为用户提供低成本、 高效率和高质量 的网络服务。 0021 在本发明的一些实施方式中, 所述历史运行健康指标包括: 所述待评估云虚拟网 关的历史监控指标值、 历。
37、史属性值、 历史故障情况; 所述待评估云虚拟网关所在的物理服务 器的历史监控指标值、 历史属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关的历史监控指标值、 历史属性值、 历史故障情况。 0022 在本发明的一些实施方式中, 所述待评估云虚拟网关的历史监控指标值包括: 所 述待评估云虚拟网关的平均每秒出流量、 平均每秒入流量、 平均每秒出包量、 平均每秒入包 量, 以及所述待评估云虚拟网关的并发连接数; 所述待评估云虚拟网关的历史属性值包括: 所述待评估云虚拟网关本身的带宽、 所述待评估云虚拟网关本身的并发连接数上限; 所述 待评估云虚拟网关的历史故障情况包括: 网络是否连通、。
38、 是否丢包; 所述待评估云虚拟网关 所在的物理服务器的历史监控指标值包括: CPU利用率、 内存利用率、 I/O繁忙程度、 网络连 通性、 网卡的出流量、 网卡的入流量、 网卡的丢包数; 所述待评估云虚拟网关所在的物理服 务器的历史属性值包括: 网卡的带宽、 所述待评估云虚拟网关所在的物理服务器可承担的 并发连接数上限、 所述待评估云虚拟网关所在的物理服务器上云虚拟网关的数量; 所述待 评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史监控指标值包括: 所述待评估 云虚拟网关所在的物理服务器上其他云虚拟网关的平均每秒出流量、 平均每秒入流量、 平 均每秒出包量、 平均每秒入包量, 以及所述待。
39、评估云虚拟网关所在的物理服务器上其他云 虚拟网关的并发连接数; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历 史属性值包括: 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关本身的带宽、 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关本身的并发连接数上限; 所述 待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史故障情况包括: 网络是否连 通、 是否丢包。 0023 在本发明的一些实施方式中, 基于所述历史运行健康指标获取样本集包括: 将所 述待评估云虚拟网关的历史监控指标值、 历史属性值, 所述待评估云虚拟网关所在的物理 服务器上其他云虚拟网关的历史监控指标值、 历。
40、史属性值, 以及所述待评估云虚拟网关所 说明书 4/13 页 9 CN 112001622 A 9 在的物理服务器的历史监控指标值、 历史属性值作为输入值; 将所述待评估云虚拟网关的 历史故障情况、 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的历史故障情 况作为目标值; 将所述输入值和所述目标值进行拼接, 得到所述样本集。 0024 本发明上述实施方式通过处理待评估云虚拟网关、 与待评估云虚拟网关同在一个 物理服务器上的其他云虚拟网关的相关历史指标数据得到样本集, 使得基于这样的样本集 得到的运行健康度评估模型全面考虑到同一物理服务器上的其他云虚拟网关与待评估云 虚拟网关之间的关联关。
41、系, 以及它们对待评估云虚拟网关的运行健康度的影响, 进而得到 更加准确的运行健康度的评估值。 0025 在本发明的一些实施方式中, 所述预处理包括: 去噪、 归一化处理。 0026 本发明上述实施方式通过对样本集进行去噪、 归一化的预处理, 可以提高基于样 本集建立的运行健康度评估模型的准确性。 0027 在本发明的一些实施方式中, 采用回归预测算法建立所述待评估云虚拟网关的运 行健康度评估模型包括: 基于所述待评估云虚拟网关的历史监控指标值、 历史属性值, 以及 所述待评估云虚拟网关所在的物理服务器的历史监控指标值、 历史属性值按照逻辑回归算 法计算所述待评估云虚拟网关的健康度基础分数; 。
42、基于所述待评估云虚拟网关所在的其他 云虚拟网关的历史监控指标值、 历史属性值, 以及所述待评估云虚拟网关所在的物理服务 器的历史监控指标值、 历史属性值按照逻辑回归算法计算所述待评估云虚拟网关所在的物 理服务器上其他云虚拟网关的健康度基础分数; 获取所述待评估云虚拟网关和所述待评估 云虚拟网关所在的物理服务器上其他云虚拟网关对健康度的影响力权重参数; 基于所述待 评估云虚拟网关的健康度基础分数、 所述待评估云虚拟网关所在的物理服务器上其他云虚 拟网关的健康度基础分数、 所述影响力权重参数确定所述运行健康度评估模型的参数值。 0028 本发明上述实施方式通过考虑与待评估云虚拟网关同在一个物理服务。
43、器上的其 他云虚拟网关对待评估云虚拟网关的运行健康度的影响, 能够获取更加准确的运行健康度 评估模型, 进而得到更加准确的运行健康度的评估值。 0029 在本发明的一些实施方式中, 利用所述训练数据训练所述运行健康度评估模型的 参数值包括: 利用所述训练数据获取基于不同参数值的所述运行健康度评估模型的预测输 出值; 利用损失函数计算所有基于所述训练数据得到的预测输出值与所述训练数据中的实 际输出值之间的偏差之和; 采用梯度下降的方法求解所述偏差之和的最小值及其对应的参 数值。 0030 本发明上述实施方式通过获取运行健康度评估模型的预测输出值与训练数据中 的实际输出值之间的偏差之和的最小值对应。
44、的参数值, 使得基于该参数值的运行健康度评 估模型更加准确, 从而获取更加准确的运行健康度的评估值。 0031 在本发明的一些实施方式中, 所述当前监控指标包括: 所述待评估云虚拟网关的 当前监控指标值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器的当前监控指标 值、 当前属性值; 所述待评估云虚拟网关所在的物理服务器上其他云虚拟网关的当前监控 指标值、 当前属性值、 当前故障情况。 0032 在本发明的一些实施方式中, 采集所述待评估云虚拟网关的历史运行健康指标包 括: 基于分布式的海量日志采集、 聚合和传输的系统Flume采集所述待评估云虚拟网关的历 史运行健康指标。 说明书 5/。
45、13 页 10 CN 112001622 A 10 0033 根据本发明的第三方面, 本发明实施方式提供一种计算机存储介质, 其上存储有 计算机可读指令, 所述计算机可读指令被处理器执行时, 使得计算机执行如下操作: 所述操 作包括如上任意一种实施方式所述评估方法所包含的步骤。 0034 根据本发明的第四方面, 本发明实施方式提供一种包括存储器和处理器的计算机 设备, 所述存储器用于存储一条或多条计算机指令, 其中, 所述一条或多条计算机指令被所 述处理器执行时能够实现如上任意一种实施方式所述的评估方法。 0035 由上述可知, 本发明实施方式提供的云虚拟网关的运行健康度评估方法、 系统、 存。
46、 储介质和设备, 基于历史运行健康度指标获取的样本集数据得到运行健康度评估模型, 获 取待评估云虚拟网关当前或未来一段时间内的运行健康度的评估值, 进而在运行健康度的 评估值较低时及时提醒运维人员主动、 提早进行排查处理, 避免云虚拟网关的故障对云上 业务造成可感知的影响, 从而在一定程度上有效地提高网络运维的效率和质量, 为用户提 供低成本、 高效率和高质量的网络服务。 附图说明 0036 图1是根据本发明一种实施方式的云虚拟网关的运行健康度评估方法的流程示意 图; 0037 图2是根据本发明实施方式的基于Flume的agent层采集历史运行健康指标数据的 方法可适用的网络架构示意图; 00。
47、38 图3是根据本发明实施方式的处理样本集数据的方法可适用的网络架构示意图; 0039 图4是根据本发明实施方式的获取运行健康度的评估值的方法可适用的网络架构 示意图; 0040 图5是根据本发明一种实施方式的云虚拟网关的运行健康度评估系统的架构图。 具体实施方式 0041 以下结合附图和具体实施方式对本发明的各个方面进行详细阐述。 其中, 众所周 知的模块、 单元及其相互之间的连接、 链接、 通信或操作没有示出或未作详细说明。 并且, 所 描述的特征、 架构或功能可在一个或一个以上实施方式中以任何方式组合。 本领域技术人 员应当理解, 下述的各种实施方式只用于举例说明, 而非用于限制本发明的。
48、保护范围。 还可 以容易理解, 本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不 同配置进行组合和设计。 0042 下面对本文中使用的术语进行简要说明。 0043 Flume: 分布式的海量日志采集、 聚合和传输的系统。 0044 MapReduce: 用于大规模数据集的并行运算的编程模型。 0045 Hadoop: 对大量数据进行分布式处理的软件框架。 0046 HDFS: Hadoop Distributed File System, Hadoop分布式文件系统。 0047 Storm: 分布式实时计算系统。 0048 Kafka: 分布式发布订阅消息系统。 0049 图。
49、1是根据本发明一种实施方式的云虚拟网关的运行健康度评估方法的流程示意 图。 说明书 6/13 页 11 CN 112001622 A 11 0050 如图1所示, 在本发明的一种实施方式中, 所述评估方法可包括: 步骤S11、 步骤 S12、 步骤S13、 步骤S14、 步骤S15和步骤S16, 下面对上述步骤进行具体的描述。 0051 在步骤S11中, 采集待评估云虚拟网关的历史运行健康指标。 0052 在可选的实施方式中, 基于Flume采集所述待评估云虚拟网关的历史运行健康指 标。 可选的, 为便于历史运行健康指标数据的离线分析, 采用Flume作为实时日志收集系统 来收集与所述待评估云。
50、虚拟网关的运行健康度相关的各个指标数据, 并将收集到的指标数 据存储为海量历史数据。 0053 本发明根据上述云虚拟网关的运行健康度评估方法提供一种采集历史运行健康 指标数据的示例, 以实现海量历史数据的存储及离线分析: 0054 Flume采用的是三层架构: agent层(代理层)、 collector层(收集层)和store层(存 储层), 每一层均可水平拓展。 0055 图2是根据本发明实施方式的基于Flume的agent层采集历史运行健康指标数据的 方法可适用的网络架构示意图。 0056 如图2所示, 将agent层部署在云虚拟网关服务器上, 其中agent包含source, chan。