《一种基于博弈论的网络控制系统调度方法.pdf》由会员分享,可在线阅读,更多相关《一种基于博弈论的网络控制系统调度方法.pdf(9页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103036982 A (43)申请公布日 2013.04.10 CN 103036982 A *CN103036982A* (21)申请号 201210543964.1 (22)申请日 2012.12.15 H04L 29/08(2006.01) (71)申请人 安徽工程大学 地址 241000 安徽省芜湖市弋江区长江南路 83 号科创中心安徽工程大学技术转移 中心 (72)发明人 陈其工 张海艳 高文根 李祖松 鲍学礼 王俊杰 邵可可 (74)专利代理机构 芜湖安汇知识产权代理有限 公司 34107 代理人 周光 (54) 发明名称 一种基于博弈论的网络控制系统调。
2、度方法 (57) 摘要 本发明公开了一种基于博弈论的网络控制 系统调度方法, 步骤为 : 构建 NCSs 调度方法的非 合作博弈模型 ; 确定 NCSs 中各控制回路的效用 函数 ; 寻找最优调度策略 ; 分析 Nash 均衡点的存 在性和唯一性 ; 运用混合自适应遗传算法求解该 Nash 均衡点 ; NCSs 中的调度器按照 Nash 均衡点 处的最优调度策略重新为每个控制回路分配网络 资源。 采用上述技术方案, 不依赖于现有的网络资 源调度机制, 为网络的服务优化提供了依据 ; 可 保证网络资源能够得到充分利用, 而且也能够确 保各个控制回路之间公平合理的竞争, 避免资源 分配出现过多或过。
3、少的现象, 从而在一定程度上 提高了网络资源利用率。 (51)Int.Cl. 权利要求书 2 页 说明书 5 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 5 页 附图 1 页 1/2 页 2 1. 一种基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的该方法包括如下步 骤 : 步骤 1 : 根据 NCSs 调度问题的特性及对 NCSs 的数学描述, 构建 NCSs 调度方法的非合 作博弈模型 ; 步骤 2 : 根据所述的非合作博弈模型并结合 NCSs 自身特性和相关的调度参数, 确定 NCSs 中各控制回路的效用函数 ; 步。
4、骤3 : 寻找最优调度策略, 等价于查找博弈模型的Nash均衡点 ; 根据所定义的效用函 数, 结合 Nash 均衡存在性的判定条件, 分析 Nash 均衡点的存在性和唯一性 ; 步骤 4 : 在明确 NCSs 调度非合作博弈模型存在唯一的 Nash 均衡点后, 运用混合自适应 遗传算法求解该 Nash 均衡点 ; 步骤5 : NCSs中的调度器按照Nash均衡点处的最优调度策略重新为每个控制回路分配 网络资源。 2. 按照权利要求 1 所述的基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的 构建 NCSs 调度方法的非合作博弈模型的方法是 : 设网络控制系统中共有 n 个控制回路,。
5、 需要调度的回路集合为 N=li|i i,n ; 则 NCSs 网络调度的非合作博弈模型可定义为一个三元组, 即 G=N,S,Ui, 其中 S 是所 有参与调度的控制回路的可行方案集 S=si|si=(pi,bi),1 i N, pi pi,min,pi,max 是 控制回路 li(以下内容中涉及控制回路 li时均简写为 li) 可用的数据传输速率, pi,min是保 证 li能够正常工作的最低数据传输速率, pi,max是 li最佳的数据传输速率 ; bi pi,min,B 是调度器预分配给 li的带宽, B 是 NCSs 的总带宽, 显然 pi,max B 和 成立, 其中 aB(0 a 。
6、1, 为一比例系数) 是调度器预留给其它信息节点的 带宽资源 ; Ui为 li的效用函数 ; 且 Ui是一个从可选传输数据传输速率和带宽值集合 S 到实数集合 R 的映射 : Ui R ; 有且只有当时, li使用策略所取得的运行效率高于 li使用策略 si所 取得的运行效率。 3. 按照权利要求 1 所述的基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的 确定 NCSs 中各控制回路的效用函数的形式 : 基于所建的非合作博弈模型, 各控制回路的效用函数 Ui可表示如下 : 式中 2 为自然数和 2 为偶数, 是根据具体的控制情况预先设定的经验常量 ; ( 1) 是 li可使用的平均。
7、带宽值, 权 利 要 求 书 CN 103036982 A 2 2/2 页 3 是 li可用数据传输速率与平均带宽值之间的最大偏差 ; 当分配给 li的带宽超过了其平均带宽值时, 效用函数的值将呈现减小的趋势, 这就反 映了当某个控制回路要求较多的带宽资源时, 其所得效用反而将越来越低, 从而也保证了 带宽资源分配的公平性。 4. 按照权利要求 1 所述的基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的 寻找最优调度策略, 或查找非合作博弈模型的 Nash 均衡点的存在性和唯一性的方法为 : 基于非合作博弈模型的网络控制系统网络调度问题实际是一个满足一定约束的最优 化问题, 即满足条。
8、件; 根据博弈理论该最优化问题的求解, 便可转化为相对应的针对相关约束的 Nash 均衡 点的求解 ; 该 Nash 均衡可描述为, 其中就是 li的最佳策略组合, 是除 li之外的所有其他控制回路的最优策略组合 ; 由于控制回路的策略组合S是非空的凸集, 且为欧式空间的一个紧子集, 另效用函数Ui 对任意 s-i S-i都是 si的拟凹连续函数, 因此根据 Nash 均衡点存在性定理可知所建 NCSs 调度的非合作博弈模型存在唯一的 Nash 均衡点。 5. 按照权利要求 1 所述的基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的 运用混合自适应遗传算法求解该 Nash 均衡点的方。
9、法是 : 依据所建的非合作博弈模型确定遗传算法中的种群大小为 m 和个体的遗传基因数为 n, 遗传基因将用实数表示, 数值与 NCSs 中各控制回路中所分配的带宽值对应, 则种群中所 有个体的遗传基因组为; 根据效用函数建立遗传算法的适应度函数为; 由此可知, 若适应度函数值越大, 就表示该组策略的效用函数之和越大, 则就越接近所 建非合作博弈调度模型的 Nash 均衡点 ; 因此, 此组遗传基因所描述的带宽分配策略就是网络带宽资源的最佳分配方案 ; 最后, 调度器依据此最佳带宽分配方案为各控制回路分配带宽值。 权 利 要 求 书 CN 103036982 A 3 1/5 页 4 一种基于博弈。
10、论的网络控制系统调度方法 技术领域 0001 本发明属于网络控制系统的技术领域, 涉及网络资源调度方法, 更具体地说, 本发 明涉及一种基于博弈论的网络控制系统调度方法。 背景技术 0002 随着计算机网络技术广泛地应用于自动控制领域, 一种新的网络化、 节点智能化、 信息综合化、 分布式的控制系统网络控制系统 (Networked Control Systems, NCSs) 便 应运而生了。网络化控制满足了复杂大系统控制和远程控制系统的客观需求, 是未来控制 系统的发展方向。由于 NCSs 是由控制和网络组成的系统, 其性能不仅依赖于所使用的控制 策略, 还依赖于网络中信息的调度策略。NC。
11、Ss 的调度是用于规定系统中通过共享通信网络 所传送的各种数据的次序和发送时刻以及时间间隔。 合理的网络调度能有效避免网络中各 信息之间产生冲突和拥塞现象, 减小网络诱导时延, 降低数据丢包率, 进一步改善系统控制 性能, 提高系统的稳定性。 0003 综合研究现有网络调度的研究成果, 从网络层次的角度可分为协议层调度和应用 层调度两类 : 0004 协议层调度一般是通过特定的网络协议来实现某些调度策略, 因而只适用于具有 调度数据包功能的网络协议, 且算法的灵活性较差。 0005 网络应用层上的调度按其侧重点不同又可具体划分为网络优先级调度与采样周 期和采样时刻的调度。 网络优先级调度就是规。
12、定通过网络连接的各智能节点 (控制器节点、 传感器节点) 发送数据的次序, 其虽然与具体的网络协议无关, 但是必须在具有优先权的网 络 (如CAN、 DeviceNet等) 上实现。 考虑到系统的控制性能的优劣直接受到NCSs中各控制回 路的采样周期的影响, 同时各控制回路的采样时刻也会影响到数据包对网络资源的争用, 由此便产生了相关的采样周期和采样时刻的调度策略。基于时间窗口的环路采样时间调 度方法是对系统中每个控制回路的采样时间进行调整并应用于周期性服务网络 ; 基于带宽 管理的控制回路采样时间调度方法是动态地计算各控制回路的采样周期, 采样周期将随状 态变量的变化进行实时更新, 且其带宽。
13、也随即动态更新分配。此外, 基于先进控制理论 (如 模糊控制、 预测控制、 自适应控制等) 的反馈调度方法虽能够使控制系统具有较高的控制性 能, 但其网络资源利用率往往都较低。 0006 在设计 NCSs 的资源调度方法时, 目前大多数的研究虽然结合了控制效果和共享 资源利用情况并在这方面也取得了一定的成果, 但是这些成果仍远远不足以解决 NCSs 在 实际应用中存在的问题, 因此仍需要结合新的理论知识来探索网络资源调度问题的解决方 法。 发明内容 0007 本发明提供一种基于博弈论的网络控制系统调度方法, 其目的是合理分配有限的 网络资源 (如带宽、 缓冲区、 频带宽度等) 。 说 明 书 。
14、CN 103036982 A 4 2/5 页 5 0008 为了实现上述目的, 本发明采取的技术方案为 : 0009 本发明所提供的基于博弈论的网络控制系统调度方法, 其特征在于 : 所述的该方 法包括如下步骤 : 0010 步骤 1 : 根据 NCSs 调度问题的特性及对 NCSs 的数学描述, 构建 NCSs 调度方法的 非合作博弈模型 ; 0011 步骤 2 : 根据所述的非合作博弈模型并结合 NCSs 自身特性和相关的调度参数, 确 定 NCSs 中各控制回路的效用函数 ; 0012 步骤3 : 寻找最优调度策略, 等价于查找博弈模型的Nash均衡点 ; 根据所定义的效 用函数, 结合。
15、 Nash 均衡存在性的判定条件, 分析 Nash 均衡点的存在性和唯一性 ; 0013 步骤 4 : 在明确 NCSs 调度非合作博弈模型存在唯一的 Nash 均衡点后, 运用混合自 适应遗传算法求解该 Nash 均衡点 ; 0014 步骤5 : NCSs中的调度器按照Nash均衡点处的最优调度策略重新为每个控制回路 分配网络资源。 0015 本发明采用上述技术方案, 不依赖于现有的网络资源调度机制, 为网络的服务优 化提供了依据 ; 所构建的 NCSs 调度非合作博弈模型能够很好地反映 NCSs 中各控制回路的 动态运行特征与相互竞争关系 ; 在 Nash 均衡点处分配网络资源可保证网络资。
16、源能够得到 充分利用, 而且也能够确保各个控制回路之间公平合理的竞争, 避免资源分配出现过多或 过少的现象, 从而在一定程度上提高了网络资源利用率。 附图说明 0016 下面是对本说明书附图作简要说明 : 0017 图 1 为含调度器的网络控制系统一般结构 ; 0018 图 2 为 Nash 均衡的混合自适应遗传算法求解流程。 具体实施方式 0019 下面对照附图, 通过对实施例的描述, 对本发明的具体实施方式作进一步详细的 说明, 以帮助本领域的技术人员对本发明的发明构思、 技术方案有更完整、 准确和深入的理 解。 0020 如图 1、 图 2 所示的本发明的技术方案, 为一种基于博弈论的网。
17、络控制系统调度方 法。 图 1 给出了网络控制系统的一般结构。 0021 网络控制系统的调度所解决的本质问题就是合理分配有限的网络资源 (如带宽、 缓冲区、 频带宽度等) 。如何有效地分配有限的网络资源, 进而最大限度地实现资源的潜在 价值, 这正是经济学研究得比较成熟的问题。 0022 NCSs 中包含有多个控制回路, 每个控制回路都是相对独立地共享一个通信网络, 即每个控制回路不知道网络中是否存在其他控制回路, 也无法获得其他控制回路的状态信 息。各个控制回路在执行任务时都将按照自己的需求占用网络资源, 并尽可能地使自身达 到最佳状态。 在网络资源受限的情况下, 各个控制回路之间是通过竞争。
18、来抢夺网络资源, 特 别是带宽资源 ; 因此, NCSs 中的各个控制回路之间就存在一个非合作博弈过程。 0023 为了实现合理分配有限的网络资源的发明目的, 本发明采取的技术方案为 : 说 明 书 CN 103036982 A 5 3/5 页 6 0024 将微观经济学中的博弈理论引入到网络控制系统的网络调度中, 提出一种基于博 弈论的网络控制系统调度方法。 0025 本发明的基于博弈论的网络控制系统调度方法, 包括如下步骤 : 0026 步骤 1 : 根据 NCSs 调度问题的特性及对 NCSs 的数学描述, 构建 NCSs 调度方法的 非合作博弈模型 ; 0027 步骤 2 : 根据所述。
19、的非合作博弈模型并结合 NCSs 自身特性和相关的调度参数, 确 定 NCSs 中各控制回路的效用函数 ; 0028 根据步骤 1 中构建的 NCSs 调度中的非合作博弈模型并结合 NCSs 自身特性和相关 的调度参数, 定义 NCSs 中各控制回路的效用函数 ; 0029 步骤3 : 寻找最优调度策略, 等价于查找博弈模型的Nash均衡点 ; 根据所定义的效 用函数, 结合 Nash 均衡存在性的判定条件, 分析 Nash 均衡点的存在性和唯一性 ; 0030 Nash 均衡是博弈论中描述非合作博弈结果的重要手段, 因此寻找最优调度策略可 等价于查找博弈模型的 Nash 均衡点。根据所定义的。
20、效用函数结合 Nash 均衡存在性的判定 条件分析 Nash 均衡点的存在性和唯一性。 0031 步骤 4 : 在明确 NCSs 调度非合作博弈模型存在唯一的 Nash 均衡点后, 运用混合自 适应遗传算法求解该 Nash 均衡点 ; 0032 在步骤 3 中明确了 NCSs 调度非合作博弈模型存在唯一的 Nash 均衡点后, 运用混 合自适应遗传算法求解该 Nash 均衡点 ; 0033 步骤5 : NCSs中的调度器按照Nash均衡点处的最优调度策略重新为每个控制回路 分配网络资源。 0034 本发明所提出的网络控制系统调度方法不依赖于现有的网络资源调度机制, 为网 络的服务优化提供了依据。
21、。所构建的 NCSs 调度非合作博弈模型能够很好地反映 NCSs 中各 控制回路的动态运行特征与相互竞争关系 ; 在 Nash 均衡点处分配网络资源可保证网络资 源能够得到充分利用, 而且也能够确保各个控制回路之间公平合理的竞争, 避免资源分配 出现过多或过少的现象, 从而在一定程度上提高了网络资源利用率。 0035 网络控制系统一般包含有至少一个控制回路, 每个控制回路由传感器、 控制器、 执 行器和被控对象组成, 用于完成一系列的任务。多个相互独立的控制回路通过中间共享的 网络形成了各自的闭环回路, 传感器与控制器之间和控制器与执行器之间的数据均通过共 享的网络来传递。网络中的 ca和 s。
22、c分别表示控制器与执行器之间的传输时延、 传感器 与控制器之间的传输时延。由于共享网络的资源有限, 因此系统在运行过程中不可避免地 会存在信息时延、 丢失和时序错乱等问题。 为了保证系统能够稳定地运行, 就要对网络中传 输的信息进行调度。 调度器用于分析系统信息, 制定相应的决策, 为各控制回路提供调度信 息, 从而保证整个 NCSs 能够稳定高效地运行。 0036 本发明提出的基于博弈论的网络控制系统调度方法, 其具体实施步骤如下 : 0037 首先, 构建网络控制系统调度方法的非合作博弈模型。所述的构建 NCSs 调度方法 的非合作博弈模型的方法是 : 0038 设网络控制系统中共有n个控。
23、制回路, 需要调度的回路集合为N=li|i1,n ; 0039 则 NCSs 网络调度的非合作博弈模型可定义为一个三元组, 即 G=N,S,Ui, 其中 S 是所有参与调度的控制回路的可行方案集S=si|si=(pi,bi),1iN, pipi,min,pi,max 说 明 书 CN 103036982 A 6 4/5 页 7 是控制回路 li(以下内容中涉及控制回路 li时均简写为 li) 可用的数据传输速率, pi,min是 保证 li能够正常工作的最低数据传输速率, pi,max是 li最佳的数据传输速率 ; 0040 bi pi,min,B 是调度器预分配给 li的带宽, B 是 NC。
24、Ss 的总带宽, 显然 pi,max B 和成立, 其中 aB(0 a 1, 为一比例系数) 是调度器预留给其它信息节点 的带宽资源 ; 0041 Ui为 li的效用函数 ; 0042 且 Ui是一个从可选传输数据传输速率和带宽值集合 S 到实数集合 R 的映射 : Ui R ; 0043 有且只有当时, li使用策略所取得的运行效率高于li使用策略si 所取得的运行效率。 0044 其次, 确定所建模型的效用函数的形式。所述的确定 NCSs 中各控制回路的效用函 数的形式 : 0045 基于所建的非合作博弈模型, 各控制回路的效用函数 Ui可表示如下 : 0046 0047 式中 2 为自然。
25、数和 2 为偶数, 是根据具体的控制情况预先设定的经验 常量 ; 0048 ( 1) 是 li可使用的平均带宽值, 是 li可用数据传输速率与平均带宽值之间的最大偏差 ; 0049 当分配给 li的带宽超过了其平均带宽值时, 效用函数的值将呈现减小的趋势, 这 就反映了当某个控制回路要求较多的带宽资源时, 其所得效用反而将越来越低, 从而也保 证了带宽资源分配的公平性。 0050 再次, 分析调度策略非合作博弈模型的 Nash 均衡点的存在性和唯一性。所述的寻 找最优调度策略, 或查找非合作博弈模型的 Nash 均衡点的存在性和唯一性的方法为 : 0051 基于非合作博弈模型的网络控制系统网络。
26、调度问题实际是一个满足一定约束的 最优化问题, 即满足条件; 0052 根据博弈理论该最优化问题的求解, 便可转化为相对应的针对相关约束的 Nash 均衡点的求解 ; 0053 该Nash均衡可描述为, 其中就是li的最佳策略组 合, 是除 li之外的所有其他控制回路的最优策略组合 ; 0054 由于控制回路的策略组合 S 是非空的凸集, 且为欧式空间的一个紧子集, 另效用 说 明 书 CN 103036982 A 7 5/5 页 8 函数 Ui对任意 s-i S-i都是 si的拟凹连续函数, 因此根据 Nash 均衡点存在性定理可知所 建 NCSs 调度的非合作博弈模型存在唯一的 Nash 。
27、均衡点。 0055 最后, 运用混合自适应遗传算法求解非合作博弈模型的 Nash 均衡点。为实现对网 络调度非合作博弈模型的 Nash 均衡点的有效求解, 本发明运用一种混合自适应遗传算法 来完成对模型的求解操作。 0056 所述的运用混合自适应遗传算法求解该 Nash 均衡点的方法是 : 0057 依据所建的非合作博弈模型确定遗传算法中的种群大小为 m 和个体的遗传基因 数为 n, 遗传基因将用实数表示, 数值与 NCSs 中各控制回路中所分配的带宽值对应, 则种群 中所有个体的遗传基因组为; 根据效用函数建立遗传算法的适应 度函数为; 0058 由此可知, 若适应度函数值越大, 就表示该组。
28、策略的效用函数之和越大, 则就越接 近所建非合作博弈调度模型的 Nash 均衡点 ; 0059 因此, 此组遗传基因所描述的带宽分配策略就是网络带宽资源的最佳分配方案 ; 0060 最后, 调度器依据此最佳带宽分配方案为各控制回路分配带宽值。 0061 图 2 为该操作的流程图。 0062 上面结合附图对本发明进行了示例性描述, 显然本发明具体实现并不受上述方式 的限制, 只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进, 或未经改 进将本发明的构思和技术方案直接应用于其它场合的, 均在本发明的保护范围之内。 说 明 书 CN 103036982 A 8 1/1 页 9 图 1 图 2 说 明 书 附 图 CN 103036982 A 9 。