《工业机械臂控制方法、装置、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《工业机械臂控制方法、装置、设备及存储介质.pdf(19页珍藏版)》请在专利查询网上搜索。
1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202310049146.4(22)申请日 2023.02.01(71)申请人 鹏城实验室地址 518000 广东省深圳市南山区兴科一街2号 申请人 广东工业大学(72)发明人 鲁仁全郭子杰李鸿一程志键任鸿儒(74)专利代理机构 深圳市世纪恒程知识产权代理事务所 44287专利代理师 罗秋莲(51)Int.Cl.B25J 9/16(2006.01)(54)发明名称工业机械臂控制方法、装置、设备及存储介质(57)摘要本发明公开了一种工业机械臂控制方法、装置、设备及存储介质,涉及智能控制技术领域,方法。
2、包括:获取工业机械臂的物理特性数据和预设性能指标;根据物理特性数据和预设性能指标,构建工业机械臂的受约束系统模型;对受约束系统模型进行等价系统转换,得到无约束系统模型;根据无约束系统模型和工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;通过自适应动态规划方法求解哈密顿雅克比贝尔曼方程,得到最优控制律,以根据最优控制律对工业机械臂进行控制。本发明解决了现有工业机械臂控制方法无法在满足预设性能指标约束的同时实现最优控制的问题,实现了对工业机械臂的高精度控制。权利要求书2页 说明书12页 附图4页CN 116604546 A2023.08.18CN 116604546 A1.一种工业机械臂控制。
3、方法,其特征在于,所述方法包括:获取工业机械臂的物理特性数据和预设性能指标;根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型;对所述受约束系统模型进行等价系统转换,得到无约束系统模型;根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。2.如权利要求1所述的工业机械臂控制方法,其特征在于,所述根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型的步骤包括:根据所述物理特性数据,构建所述工业机械臂的状态空。
4、间方程;根据所述预设性能指标,定义预设性能函数;根据所述状态空间方程和所述预设性能函数,得到所述受约束系统模型。3.如权利要求2所述的工业机械臂控制方法,其特征在于,所述根据所述物理特性数据,构建所述工业机械臂的状态空间方程的步骤包括:对所述物理特性数据进行建模,得到所述工业机械臂的动力学模型;对所述动力学模型进行转换,得到所述工业机械臂的状态空间方程。4.如权利要求1所述的工业机械臂控制方法,其特征在于,所述根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程的步骤包括:根据所述无约束系统模型和所述工业机械臂的最优控制策略,定义代价函数;根据所述代价函数,构建哈密。
5、顿雅克比贝尔曼方程。5.如权利要求4所述的工业机械臂控制方法,其特征在于,所述根据所述无约束系统模型和所述工业机械臂的最优控制策略,定义代价函数的步骤包括:根据所述无约束系统模型,定义位置跟踪误差和混合误差;根据所述位置跟踪误差和所述混合误差,得到误差向量;根据所述误差向量和所述工业机械臂的最优控制策略,定义代价函数。6.如权利要求4所述的工业机械臂控制方法,其特征在于,所述根据所述代价函数,构建哈密顿雅克比贝尔曼方程的步骤包括:根据所述代价函数,定义哈密顿函数和最优代价函数;利用贝尔曼最优原则求解所述最优代价函数,得到所述最优代价函数的最优解;将所述最优解代入所述哈密顿函数,得到所述哈密顿雅。
6、克比贝尔曼方程。7.如权利要求1所述的工业机械臂控制方法,其特征在于,所述通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律的步骤包括:采用基于神经网络架构的自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律。8.一种工业机械臂控制装置,其特征在于,所述装置包括:数据获取模块,用于获取工业机械臂的物理特性数据和预设性能指标;模型构建模块,用于根据所述物理特性数据和所述预设性能指标,构建所述工业机械权利要求书1/2 页2CN 116604546 A2臂的受约束系统模型;系统转换模块,用于对所述受约束系统模型进行等价系统转换,得到无约束系统模型;方程构建模块,用于根。
7、据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;最优控制模块,用于通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。9.一种工业机械臂控制设备,其特征在于,所述设备包括处理器和存储器,所述存储器上存储有工业机械臂控制程序,所述工业机械臂控制程序被所述处理器执行时,实现如权利要求1至7中任一项所述的工业机械臂控制方法。10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被一个或多个处理器执行时,实现如权利要求1至7中任一项所述的工业机械臂控制方法。权利要求书2/2。
8、 页3CN 116604546 A3工业机械臂控制方法、装置、设备及存储介质技术领域0001本发明涉及智能控制技术领域,尤其涉及一种工业机械臂控制方法、装置、设备及存储介质。背景技术0002随着技术的不断发展及生产效率与操作精度的不断提高,工业机械臂已被广泛应用于对轨迹跟踪精度有较高要求的机械加工、装配及焊接等行业。为了提高工业机械臂的控制精度,通常需要对性能指标提出要求,因此,在控制器设计过程中结合预设性能指标进行控制具有重要意义。最优控制是一类考虑系统控制性能和节能效应的控制策略,工业机械臂的运动过程属于高度耦合的非线性系统,这给传统的最优控制方法带来了巨大的挑战。0003因此,设计一种满。
9、足预设性能指标约束且能实现最优控制的工业机械臂控制器是亟待解决的问题。发明内容0004本发明的主要目的在于:提供一种工业机械臂控制方法、装置、设备及存储介质,旨在解决现有工业机械臂控制方法无法在满足预设性能指标约束的同时实现最优控制的技术问题。0005为实现上述目的,本发明采用如下技术方案:0006第一方面,本发明提供了一种工业机械臂控制方法,所述方法包括:0007获取工业机械臂的物理特性数据和预设性能指标;0008根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型;0009对所述受约束系统模型进行等价系统转换,得到无约束系统模型;0010根据所述无约束系统模型和所述工。
10、业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;0011通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。0012可选地,上述工业机械臂控制方法中,所述根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型的步骤包括:0013根据所述物理特性数据,构建所述工业机械臂的状态空间方程;0014根据所述预设性能指标,定义预设性能函数;0015根据所述状态空间方程和所述预设性能函数,得到所述受约束系统模型。0016可选地,上述工业机械臂控制方法中,所述根据所述物理特性数据,构建所述工业机械臂的状态空间方程的步骤包。
11、括:0017对所述物理特性数据进行建模,得到所述工业机械臂的动力学模型;说明书1/12 页4CN 116604546 A40018对所述动力学模型进行转换,得到所述工业机械臂的状态空间方程。0019可选地,上述工业机械臂控制方法中,所述根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程的步骤包括:0020根据所述无约束系统模型和所述工业机械臂的最优控制策略,定义代价函数;0021根据所述代价函数,构建哈密顿雅克比贝尔曼方程。0022可选地,上述工业机械臂控制方法中,所述根据所述无约束系统模型和所述工业机械臂的最优控制策略,定义代价函数的步骤包括:0023根据所述无。
12、约束系统模型,定义位置跟踪误差和混合误差;0024根据所述位置跟踪误差和所述混合误差,得到误差向量;0025根据所述误差向量和所述工业机械臂的最优控制策略,定义代价函数。0026可选地,上述工业机械臂控制方法中,所述根据所述代价函数,构建哈密顿雅克比贝尔曼方程的步骤包括:0027根据所述代价函数,定义哈密顿函数和最优代价函数;0028利用贝尔曼最优原则求解所述最优代价函数,得到所述最优代价函数的最优解;0029将所述最优解代入所述哈密顿函数,得到所述哈密顿雅克比贝尔曼方程。0030可选地,上述工业机械臂控制方法中,所述通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律的步骤包。
13、括:0031采用基于神经网络架构的自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律。0032第二方面,本发明提供了一种工业机械臂控制装置,所述装置包括:0033数据获取模块,用于获取工业机械臂的物理特性数据和预设性能指标;0034模型构建模块,用于根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型;0035系统转换模块,用于对所述受约束系统模型进行等价系统转换,得到无约束系统模型;0036方程构建模块,用于根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;0037最优控制模块,用于通过自适应动态规划方法求解所述哈密顿雅克比。
14、贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。0038第三方面,本发明提供了一种工业机械臂控制设备,所述设备包括处理器和存储器,所述存储器中存储有工业机械臂控制程序,所述工业机械臂控制程序被所述处理器执行时,实现如上述的工业机械臂控制方法。0039第四方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被一个或多个处理器执行时,实现如上述的工业机械臂控制方法。0040本发明提供的上述一个或多个技术方案,可以具有如下优点或至少实现了如下技术效果:0041本发明提出的一种工业机械臂控制方法、装置、设备及存储介质,通过根据工业机械臂的物。
15、理特性数据和预设性能指标构建工业机械臂的受约束系统模型,对受约束系统模型进行等价系统转换,得到无约束系统模型,再根据无约束系统模型和工业机械臂的最优说明书2/12 页5CN 116604546 A5控制策略构建哈密顿雅克比贝尔曼方程,通过自适应动态规划方法求解哈密顿雅克比贝尔曼方程,得到最优控制律,从而根据最优控制律对工业机械臂进行控制,在保证预设性能指标的基础上进行最优控制,实现了对工业机械臂的高精度控制;本发明的方法可以使得工业机械臂的系统输出有效跟踪参考信号,并使得跟踪误差等满足预设要求,提高了控制精度,还具有节能效应。附图说明0042为了更清楚地说明本发明实施例或现有技术中的技术方案,。
16、下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的这些附图获得其他的附图。0043图1为本发明工业机械臂控制方法的流程示意图;0044图2为本发明涉及的工业机械臂控制设备的硬件结构示意图;0045图3为本发明实施例一中单连杆机械臂的物理特性示意图;0046图4为本发明实施例一中评价网络权重的收敛曲线图;0047图5为本发明实施例一中参考信号yd与系统状态x1的曲线图;0048图6为本发明实施例一中参考信号与系统状态x2的曲线图;0049图7为本发明实施例一中跟。
17、踪误差与预设性能界线的曲线图;0050图8为本发明工业机械臂控制装置的功能模块示意图。0051本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式0052为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。0053需要说明,在本发明中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要。
18、素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。另外,在本发明中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。另外,各个实施例的技术方案可以相互结合,但是,是以本领域普通技术人员能够实现为基础,当技术方。
19、案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。0054对现有技术的分析发现,快速响应、高精度的位置跟踪控制一直以来都是工业机械臂的研究热点,目前,大多数对工业机械臂控制方法都停留在保证跟踪误差渐进收敛的阶段,存在反应速度慢,超调量过高等问题,为进一步提高工业机械臂的控制精度,通常需说明书3/12 页6CN 116604546 A6要对收敛速率、最大超调量、稳态误差等性能指标提出要求。因此,在控制器设计过程中结合预设性能指标进行控制具有重要意义。0055此外,在关注工业机械臂高精度控制的同时,工业界也对其能耗提出了更高的要求。降低工业机械臂的。
20、控制成本,减少对能源的消耗,对当前工业发展来说尤为重要。最优控制是一类考虑系统控制性能和节能效应的控制策略。研究表明,工业机械臂的运动过程属于高度耦合的非线性系统,这给传统的最优控制方法带来了巨大的挑战。0056针对强非线性系统的最优控制问题的解决方案有自适应动态规划方法。基于自适应动态规划设计技术,所得到的最优控制器在保证被控系统稳定的同时,还能使系统性能达到最优。然而,目前来说,对于工业机械臂的高精度跟踪控制问题,设计满足预设性能指标约束的最优控制器仍然是个亟待解决的问题。0057鉴于现有技术中工业机械臂控制方法无法在满足预设性能指标约束的同时实现最优控制的技术问题,本发明提供了一种工业机。
21、械臂控制方法,总体思路如下:0058获取工业机械臂的物理特性数据和预设性能指标;根据物理特性数据和预设性能指标,构建工业机械臂的受约束系统模型;对受约束系统模型进行等价系统转换,得到无约束系统模型;根据无约束系统模型和工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;通过自适应动态规划方法求解哈密顿雅克比贝尔曼方程,得到最优控制律,以根据最优控制律对工业机械臂进行控制。0059通过上述技术方案,在保证预设性能指标的基础上进行最优控制,实现了对工业机械臂的高精度控制;本发明的方法可以使得工业机械臂的系统输出有效跟踪参考信号,并使得跟踪误差等满足预设要求,提高了控制精度,还具有节能效应。006。
22、0下面结合附图,通过具体的实施例和实施方式对本发明提供的工业机械臂控制方法、装置、设备及存储介质进行详细说明。0061实施例一0062参照图1的流程示意图,提出本发明工业机械臂控制方法的第一实施例,该工业机械臂控制方法应用于工业机械臂控制设备。0063工业机械臂控制设备是指能够实现数据传输的终端设备或控制设备,可以是手机、电脑、嵌入式工控机等终端设备,也可以是位于系统内的控制器、处理器等控制设备。0064如图2所示,为工业机械臂控制设备的硬件结构示意图。工业机械臂控制设备可以包括:处理器1001,例如CPU(Central Processing Unit,中央处理器),通信总线1002,用户接。
23、口1003,网络接口1004,存储器1005。0065具体的,通信总线1002用于实现这些组件之间的连接通信;用户接口1003用于连接客户端,与客户端进行数据通信,用户接口1003可以包括输出单元,如显示屏、输入单元,如键盘;网络接口1004用于连接后台服务器,与后台服务器进行数据通信,网络接口1004可以包括输入/输出接口,比如标准的有线接口、无线接口,如WiFi接口;存储器1005用于存储各种类型的数据,这些数据例如可以包括该工业机械臂控制设备中任何应用程序或方法的指令,以及应用程序相关的数据,存储器1005可以是高速RAM存储器,也可以是稳定的存储器,例如磁盘存储器;可选的,存储器100。
24、5还可以是独立于处理器1001的存储装置,继续参照图2,存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及工业机械臂控制程序;说明书4/12 页7CN 116604546 A70066处理器1001用于调用存储器1005中存储的工业机械臂控制程序,并执行以下操作:0067获取工业机械臂的物理特性数据和预设性能指标;0068根据物理特性数据和预设性能指标,构建工业机械臂的受约束系统模型;0069对受约束系统模型进行等价系统转换,得到无约束系统模型;0070根据无约束系统模型和工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;0071通过自适应动态规划方法求解哈密顿雅克比贝尔曼方。
25、程,得到最优控制律,以根据最优控制律对工业机械臂进行控制。0072基于上述的工业机械臂控制设备,下面结合图1所示的流程示意图,对本实施例的工业机械臂控制方法进行详细描述。该方法可以包括以下步骤:0073步骤S100:获取工业机械臂的物理特性数据和预设性能指标。0074具体的,工业机械臂可以是单连杆机械臂,例如一类非线性单连杆机械臂。物理特性数据是指该工业机械臂的硬件结构所对应的机械特性,例如工业机械臂的有效载荷的质量、机械臂的长度、转动惯量、摩擦力系数、转动角度和控制输入等参数特性。预设性能指标是指工业机械臂实现预设性能控制的参数指标,例如工业机械臂的跟踪误差要求,跟踪误差为工业机械臂的输出信。
26、号与需要跟踪的输入信号的差值,跟踪误差指标可以是一个范围值。0075步骤S200:根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型。0076具体的,控制设备获取到工业机械臂的物理特性数据和预设性能指标后,可以构建该工业机械臂的受约束系统模型。该模型可以是动力学模型,也可以是状态方程的模型。0077进一步地,步骤S200可以包括:0078步骤S210:根据所述物理特性数据,构建所述工业机械臂的状态空间方程。0079具体的,根据工业机械臂的物理特性数据构建状态空间方程时,可以先建立一个动力学模型再转换成状态空间方程的形式,也可以通过设定好的程序或方法,例如一些现有的建模软。
27、件,直接将物理特性数据输入后获得对应的状态空间方程。0080更进一步地,步骤S210可以包括:0081步骤S211:对所述物理特性数据进行建模,得到所述工业机械臂的动力学模型。0082本实施例中,以一类单连杆机械臂为例,如图1所示为单连杆机械臂的物理特性示意图,获取单连杆机械臂的物理特性,包括单连杆机械臂的有效载荷的质量M,重力加速度g,单连杆机械臂的长度H,转动角度 (t),转动惯量G,控制设备对单连杆机械臂的控制输入u(t)。对单连杆机械臂的物理特性进行建模,得到的动力学模型为:00830084其中,M表示单连杆机械臂的有效载荷的质量,g表示重力加速度,H表示单连杆机械臂的长度,G表示转动。
28、惯量,D表示摩擦力系数,(t)表示转动角度,u(t)表示控制输入,t表示时间。0085步骤S212:对所述动力学模型进行转换,得到所述工业机械臂的状态空间方程。0086本实施例中,根据单连杆机械臂的物理特性,可以将建模得到的动力学模型的方说明书5/12 页8CN 116604546 A8程转化为状态空间方程。令x1 (t),得到单连杆机械臂的状态空间方程为:008700880089yx10090其中,y表示工业机械臂的输出信号。0091假设该单连杆机械臂的需要跟踪的输入信号为yd,其一阶导数二阶导数均存在,那么可以进而得到单连杆机械臂的状态空间方程的紧凑结构:00920093yx10094其中。
29、,0095步骤S220:根据所述预设性能指标,定义预设性能函数;0096预设性能控制是一种可以预先确定收敛速度与控制精度等动态性能指标的实用性技术,可以使得工业机械臂的跟踪误差保持在两个指定性能函数组成的有限范围内,从而保证了工业机械臂的高动态性能。0097本实施例中,单连杆机械臂的跟踪误差为输出信号y与需要跟踪的输入信号yd的差值,假设该单连杆机械臂的跟踪误差要求为位于b与B之间,则预设性能指标为byydB,则根据单连杆机械臂的预设性能指标确定的预设性能函数为:009800990100其中,1,l1,1,2,l2和2均为正的设计参数,可根据实际需要设定。0101步骤S230:根据所述状态空间。
30、方程和所述预设性能函数,得到所述受约束系统模型。0102本实施例中,根据预设性能函数可以得到单连杆机械臂的输出约束为b+ydyB+yd,再结合前述状态空间方程,可得到受约束系统模型。0103步骤S300:对所述受约束系统模型进行等价系统转换,得到无约束系统模型。0104本实施例中,为了实现高精度控制的目标,基于预设性能函数的系统转换技术被引入。对于单连杆机械臂的输出信号,定义一个非线性映射函数为:01051T(x1,B,b,yd)0106其中,a tanh()表示反正切函数;0107对该非线性映射函数求导,可以得到:0108说明书6/12 页9CN 116604546 A90109令继续得到:。
31、011001110112其中,01130114利用系统变换技术来处理预设性能约束问题,通过定义基于预设性能指标的非线性映射函数,可以把受约束的系统转化成无约束的等价系统。针对转化后的无约束系统设计的控制策略可以使得工业机械臂的跟踪误差保持在两个预设性能函数组成的有限范围内,例如上述的b与B范围内,从而有效提高了控制精度。0115步骤S400:根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程。0116进一步地,步骤S400可以包括:0117步骤S410:根据所述无约束系统模型和所述工业机械臂的最优控制策略,定义代价函数。0118具体的,为均衡控制精度和控制输入所消。
32、耗的能量,从而实现最优控制的目标,定义一个代价函数。0119更进一步地,步骤S410可以包括:0120步骤S411:根据所述无约束系统模型,定义位置跟踪误差和混合误差。0121本实施例中,针对转化后无约束的系统,定义位置跟踪误差z为:0122z 1sd0123其中,0124并定义混合误差 为:01250126其中,是一个正常数,可根据实际需要设定,表示转动速率跟踪误差,为sd的一阶导数。0127步骤S412:根据所述位置跟踪误差和所述混合误差,得到误差向量。0128本实施例中,基于前述定义的位置跟踪误差z和混合误差,定义一个新的误差向量X为:01290130从而可以得到误差向量X的动力学方程为。
33、:01310132其中,说明书7/12 页10CN 116604546 A1001330134步骤S413:根据所述误差向量和所述工业机械臂的最优控制策略,定义代价函数。0135本实施例中,根据误差向量和工业机械臂的最优控制策略,定义的代价函数为:01360137其中,是正定矩阵,R是正常数,可根据实际需要设定,R0。0138步骤S420:根据所述代价函数,构建哈密顿雅克比贝尔曼方程。0139具体的,通过基于最优控制策略定义的代价函数来推导哈密顿雅克比贝尔曼方程,可以将最优控制问题转化成求解哈密顿雅克比贝尔曼方程。0140更进一步地,步骤S420可以包括:0141步骤S421:根据所述代价函数。
34、,定义哈密顿函数和最优代价函数。0142本实施例中,根据步骤S413定义的代价函数定义哈密顿函数为:01430144其中,0145最优控制时,代价函数要实现最小,以通过最小的控制输入得到期望的控制精度。本实施例中,定义最优代价函数为:01460147其中,表示针对单连杆机械臂的允许的控制策略的集合,V*(X)满足V*(0)0。0148步骤S422:利用贝尔曼最优原则求解所述最优代价函数,得到所述最优代价函数的最优解。0149根据贝尔曼最优原则,可以得到01500151其中,0152由可以得到最优代价函数的最优解为:01530154步骤S423:将所述最优解代入所述哈密顿函数,得到所述哈密顿雅克。
35、比贝尔曼方程。0155本实施例中,将最优解u*(t)代入步骤S421定义的哈密顿函数,可以得到哈密顿雅克比贝尔曼方程为:说明书8/12 页11CN 116604546 A1101560157步骤S500:通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。0158具体的,由于哈密顿雅克比贝尔曼方程的强非线性性质,很难直接求解得到最优代价函数和最优控制律。因此,可以采用单网络的自适应动态规划方法近似求解哈密顿雅克比贝尔曼方程。0159进一步地,步骤S500可以包括:0160步骤S510:采用基于神经网络架构的自适应动态规划方法求解所。
36、述哈密顿雅克比贝尔曼方程,得到最优控制律。0161本实施例中,基于神经网络架构建立单网络的评价网络,最优代价函数V*(X)可以被评价网络近似为:016201630164其中,为理想的权重向量,为基函数向量,为近似误差,m表示神经网络节点数量,且0165令表示理想权重的估计值,最优代价函数可以估计为:016601670168则可以得到近似的最优控制律为:01690170从而控制设备可以根据该最优控制律来对应控制该单连杆机械臂,保证预设性能指标的基础上进行最优控制,并实现对该单连杆机械臂的高精度控制。0171通过单网络自适应动态规划方法来近似获得最优控制律,实现对工业机械臂的控制,并采用单评价网络。
37、来近似最优代价函数,相比传统的执行评价双网络结构,有助于减少计算量和内存需求。0172可选地,设计的评价网络的权重更新律可以为:01730174其中,为正的设计参数,可根据实际需要设定,0175为了验证本实施例提供的工业机械臂控制方法的有效性,进行如下仿真实验:说明书9/12 页12CN 116604546 A120176在仿真实验中,控制目标设定为使单连杆机械臂的输出信号y以最优的方式跟踪上参考信号yd0.2sin(t)。根据单连杆机械臂的实际系统,物理特性数据分别取值为M1kg,g9.8m/s2,l1m,D2Nms/rad。预设性能函数为b0.1et和B0.1+et,单连杆机械臂的状态初始。
38、值为x1(0)0.6,x2(0)1.5。评价网络的函数为c(X)z2,2,z T,其权重初始值为wc(0)100,250,50T。另外,设定其他参数为Q800,0;0,800,R1,2。0177选取李亚普诺夫函数求时间导数的方式来进行结果分析,基于仿真实验中实际情况所设计的参数,此处不再举例,分析后可以得到根据李亚普诺夫稳定性定理可以知道,跟踪误差z和混合误差以及评价网络的权重估计误差都是一致且最终有界的,即说明单连杆机械臂的输出信号y可以跟踪上参考信号yd,评价网络的权重可以收敛接近于理想值,如图4所示为评价网络权重的收敛曲线图,图中,横轴表示时间,单位为秒(s),纵轴表示评价网络权重的值。。
39、由该图可以看出,评价网络可以准确近似代价函数,从而所得到的控制输入u(t)则可以看成是最优的。0178如图5所示为本实施例中参考信号yd与系统状态x1的曲线图,图中,横轴表示时间,单位为秒(s),纵轴表示各曲线对应的值;如图6所示为本实施例中参考信号与系统状态x2的曲线图,图中,横轴表示时间,单位为秒(s),纵轴表示各曲线对应的值;如图7所示为本实施例中跟踪误差与预设性能界线的曲线图,图中,横轴表示时间,单位为秒(s),纵轴表示各曲线对应的值,其中,预设性能界线为预设性能指标的取值所对应的曲线。由图5图7可以看出,输出信号y下所对应的单连杆机械臂的系统状态与参考信号yd是保持一致的,该控制方法。
40、的跟踪该效果好,且跟踪误差满足预设性能指标的要求,可以实现单连杆机械臂的高精度控制。0179本实施例提供的工业机械臂控制方法,通过根据工业机械臂的物理特性数据和预设性能指标构建工业机械臂的受约束系统模型,对受约束系统模型进行等价系统转换,得到无约束系统模型,再根据无约束系统模型和工业机械臂的最优控制策略构建哈密顿雅克比贝尔曼方程,通过自适应动态规划方法求解哈密顿雅克比贝尔曼方程,得到最优控制律,从而根据最优控制律对工业机械臂进行控制,在保证预设性能指标的基础上进行最优控制,实现了对工业机械臂的高精度控制;本发明的方法可以使得工业机械臂的系统输出有效跟踪参考信号,并使得跟踪误差等满足预设要求,提。
41、高了控制精度,还具有节能效应。0180实施例二0181基于同一发明构思,参照图8,提出本发明工业机械臂控制装置的第一实施例,该装置可以为虚拟装置,应用于工业机械臂控制设备。0182下面结合图8所示的功能模块示意图,对本实施例提供的工业机械臂控制装置进行详细描述,装置可以包括:0183数据获取模块,用于获取工业机械臂的物理特性数据和预设性能指标;0184模型构建模块,用于根据所述物理特性数据和所述预设性能指标,构建所述工业机械臂的受约束系统模型;说明书10/12 页13CN 116604546 A130185系统转换模块,用于对所述受约束系统模型进行等价系统转换,得到无约束系统模型;0186方程。
42、构建模块,用于根据所述无约束系统模型和所述工业机械臂的最优控制策略,构建哈密顿雅克比贝尔曼方程;0187最优控制模块,用于通过自适应动态规划方法求解所述哈密顿雅克比贝尔曼方程,得到最优控制律,以根据所述最优控制律对所述工业机械臂进行控制。0188需要说明,本实施例提供的工业机械臂控制装置中各个模块可实现的功能和对应达到的技术效果可以参照本发明工业机械臂控制方法各个实施例中具体实施方式的描述,为了说明书的简洁,此处不再赘述。0189实施例三0190基于同一发明构思,参照图2的硬件结构示意图,本实施例提供了一种工业机械臂控制设备,该设备可以包括处理器和存储器,存储器中存储有工业机械臂控制程序,该工。
43、业机械臂控制程序被处理器执行时,实现本发明工业机械臂控制方法各个实施例的全部或部分步骤。0191具体的,工业机械臂控制设备是指能够实现数据传输的终端设备或控制设备,可以是手机、电脑、嵌入式工控机等终端设备,也可以是位于系统内的控制器、处理器等控制设备。0192本领域技术人员可以理解,图2中示出的硬件结构并不构成对本发明工业机械臂控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。0193可以理解,工业机械臂控制设备还可以包括通信总线,用户接口和网络接口。其中,通信总线用于实现这些组件之间的连接通信;用户接口用于连接客户端,与客户端进行数据通信,用户接口可以包括。
44、输出单元,如显示屏、输入单元,如键盘;网络接口用于连接后台服务器,与后台服务器进行数据通信,网络接口可以包括输入/输出接口,比如标准的有线接口、无线接口。0194存储器用于存储各种类型的数据,这些数据例如可以包括该工业机械臂控制设备中任何应用程序或方法的指令,以及应用程序相关的数据。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),随机存取存储器(Random Access Memory,简称RAM),电可擦除可编程只读存储器(Electrically Erasable Progra。
45、mmable ReadOnly Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable ReadOnly Memory,简称EPROM),可编程只读存储器(Programmable ReadOnly Memory,简称PROM),只读存储器(ReadOnly Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘,可选的,存储器还可以是独立于处理器的存储装置。0195处理器用于调用存储器中存储的工业机械臂控制程序,并执行如上述的工业机械臂控制方法,处理器可以是专用集成电路(Application Specific Integrated Cir。
46、cuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制说明书11/12 页14CN 116604546 A14器、微控制器、微处理器或其他电子元件,用于执行如上述工业机械臂控制方法各个实施例的全部或部分步骤。0196实施例四0197基于同一发明构思,本实施例提供了一种。
47、计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、磁性存储器、磁盘、光盘、服务器等等,该存储介质上存储有计算机程序,该计算机程序可被一个或多个处理器执行,该计算机程序被处理器执行时可以实现本发明工业机械臂控制方法各个实施例的全部或部分步骤。0198需要说明,上述本发明实施例序号仅为了描述,不代表实施例的优劣。以上实施例仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均包括在本发明的专利保护范围内。说明书12/12 页15CN 116604546 A15图1图2说明书附图1/4 页16CN 116604546 A16图3图4说明书附图2/4 页17CN 116604546 A17图5图6说明书附图3/4 页18CN 116604546 A18图7图8说明书附图4/4 页19CN 116604546 A19。