空间机器人不仅能降低宇航员出舱活动的危险,还可以减少载人航天的费用,因此,对空间机器人的动力学与控制进行研究是当前航天领域的研究热点[1-3]。空间机器人的执行器长期重复地执行控制指令,极易发生失效故障,而执行器的失效,轻则导致系统控制精度下降,重则导致整个控制系统崩溃。由此可见,空间机器人的执行器失效是一类发生几率高且危害大的故障。值得一提的是,空间机器人由于缺少地面站的支持,一旦执行器发生故障,往往是无法维修的,因此在不对其进行外部维修而仅依靠自身容错能力来维持控制系统的可靠运行,在整个航天任务中显得至关重要[4-6]。
空间机器人的载体基座处于自由漂浮状态,机械臂关节与载体之间存在强烈的运动学与动力学耦合作用,这就导致对地面机器人行之有效的控制方法通常都难以直接推广到对空间机器人的控制当中[7-9]。近年来,空间机器人控制方法的研究在理论和实际应用中都取得了一些新成果。针对受外部扰动的空间机器人,于潇雁等[10]设计了一种无速度反馈的增广自适应算法,该算法仅需测量系统的位置信息就可以实现期望轨迹的精确跟踪控制;对于空间机器人执行器输出力矩受限的问题,梁捷等[11]提出了一种自适应抗饱和模糊神经网络控制器,实现了有限输出力矩条件下载体与机械臂关节之间的协调运动。对于参数不确定与受外部干扰的空间机器人,谢立敏等[12]提出了一种鲁棒反步控制法,保证了机械臂运动轨迹相对参考轨迹的渐进跟踪。叶柄能等[13]基于时延估计技术对参数不确定的空间机器人提出了一种鲁棒H"控制方法。但以上研究并未考虑执行器部分失效故障对系统控制性能的影响。LUCA等[14]利用高阶滑模观测器实现了对机械臂系统执行器故障的实时估计,但并未给出有效的容错控制方法以实现对关节期望轨迹的跟踪控制。对于执行器发生部分失效故障的可重构机械臂,赵博等[15]设计了一种基于神经网络的分散容错控制方法,但该方法需要测量系统的速度信号。当前,针对执行器故障的容错控制研究主要集中于地面机器人,而专门针对空间机器人的相关研究尚不多见。
本文针对执行器发生部分失效故障的空间机器人,设计了一种非奇异终端滑模分散容错控制方法。
做平面运动的n连杆空间机械臂系统结构如图1所示。该系统由自由漂浮的卫星基座(载体)B0 与刚性臂Bi(i=1,2,...,n)组成。其中,OXY为系统的惯性坐标系,oixiyi为各分体(载体或某刚性臂)的主轴坐标系;Oc为系统质心,Oci为各分体的质心,Oi为各分体的转动中心,且Oc0与O0重合;忽略安装在各分体上的驱动电机的质量[12],mi、Ji 分别为各分体的质量和转动惯量;l0为基座转动中心O0与刚性臂B1的转动中心O1之间的距离,li为机械臂Bi的长度,di为转动中心Oi到质心Oci之间的距离;ri、rc分别为各分体质心Oci和系统质心Oc相对坐标原点O的矢径;θ0为y0轴与Y 轴之间的夹角,θi为yi-1与yi之间的夹角。载体可做平面移动与绕其转动中心O0的平面转动,机械臂Bi做绕Oi的平面转动。
图1 漂浮基n连杆空间机械臂
Fig.1 A free-floating n-link space manipulator
考虑在每个分体上安装执行器(驱动电机)以控制其转动。执行器故障可分为加性故障与乘性故障,本文仅考虑乘性故障,因此将故障建模成乘积因子的形式[6]。假设此空间机械臂在运动过程中不受外部力或(和)力矩作用,则系统满足线动量守恒定理。根据拉格朗日法,可得载体位置不控、姿态受控的n连杆空间机器人的系统动力学方程为
式中,q=[θ0,θ1,…,θn]T为系统的广义坐标;D(q)∈R(n+1)×(n+1)为系统的对称、正定惯性矩阵;H(q,q·)q· 为系统包含科氏力、离心力的列向量;τ为载体与关节的执行器驱动力矩组成的列向量;ρ为表示执行器的有效因子的对角矩阵。
第i个子系统执行器的有效因子满足0<ρi≤1(i=1,2,…,n+1),ρi=1表示第i个执行器正常工作,0<ρi<1表示第i个执行器发生部分失效故障但仍在工作,因此有效因子可作为执行器当前健康状态的表征。
空间机器人系统动力学方程(式(1))中的相关矩阵具有如下性质[10-11]。
性质1 矩阵D(q)为有界矩阵,即‖D(q)‖≤ξD,其中ξD为正常数,‖·‖表示标准欧氏范数。
性质2 矩阵D(q)与H(q,q·)满足斜对称关系,即yT(D· (q)-2 H(q,q·))y=0,y∈Rn+1。
传统的集中控制方法存在控制器维数高、结构复杂、计算量大的问题,尤其是随着杆件数量(自由度)的增加,这些问题将变得更加突出。为了简化控制结构,可将各分体考虑为一个交联子系统,采用分散控制器对每个子系统进行单独控制,同时利用分散神经网络对交联项进行补偿。
从式(1)的系统动力学方程中分离出局部变量(qi,q·i,q··i),i=1,2,…,n+1,则子系统的动力学模型可以描述为[15]
式中,Di(qi)为子系统的惯性参数项; 为子系统科氏力、离心力项; 分别为向量τ的第i个元素;Dij(q)、Hij(q,q·)分别为矩阵D(q)、H(q,q·)的第ij 个元素;Zi()为子系统交联项。
定义子系统的状态向量xi=(xi1,xi2)T=()T,i=1,2,…,n+1,则式(2)可写成如下的状态空间方程
因此,本文的控制目标是针对载体位置不控、姿态受控的空间机器人动力学子系统(式(2)),设计一种融合有效因子的非奇异终端滑模容错控制器。利用神经网络对系统的执行器故障进行估计,并自适应地补偿神经网络逼近误差,保证控制系统的稳定性,使得空间机器人在执行器发生故障的情况下,系统输出轨迹仍然能跟踪给定期望轨迹。
定义qi、q·i 分别为qi 与q·i 的观测值,令xi1=qi,xi2=q·i。设计分散滑模观测器为
式中,ki1为增益fi(qi,q·i)与gi(qi)的神经网络估计;vi(ei2,θip)为补偿交联项对系统影响的待设计项;δi用于补偿神经网络估计误差对控制精度的影响。
定义状态xij的观测误差为eij=xij-xij(j=1,2),结合式(4)与式(5)可得相应的状态误差动力学方程为
式 中θif),gi(qi),gi(qi,θig),hi(q,q· ,q·· )和 vi(ei2,θip)的 简写形式。
由式(4)可知,fi(qi,q·i)、gi(qi)分别为关于(qi,q·i)和qi 的非线性未知函数。由于神经网络函数能以任意精度逼近紧集内的非线性光滑函数[15],故采用学习速度快 的径向基(radial basis function,RBF)神经网络,分别以(qi,q·i)与qi 为输入样本,利用 RBF神经网络对fi(qi,q·i)与gi(qi)进行逼近。假设理想神经网络逼近为
式中,θif、θig分别为fi(qi,q·i)和gi(qi)的理想神经网络权值;σif、σig为神经网络基函数;εif、εig为神经网络估计误差,且εif与εig未知有界。
定义θif、θig分别为θif、θig的估计值,σif、σig分别为σif与σig的估计值,则fi(qi,q·i)与gi(qi)的RBF神经网络输出为
定义权值估计误差θ~if=θif-θif,θ~ig=θig-θig,有
采用下式所示的RBF神经网络补偿交联项hi(q ,q ·,q··)对系统的影响:
式中,θip为理想权值θip的估 计值,θ~ip为 权值估计误差;σip为基函数σip的估计值,σ~ip为估计误差。
假设1 交联项hi(q,q·,q··)有界且满足
自适应参数θif,θig,θip与δi 的更新律设计为
式中,ηif、ηig、ηip、λi 为自适应调节系数,且均为正常数。
定义神经网络的最小估计误差为
假设2 神经网络估计误差ωi= ωi1+ωi2有界,且满足
式中,δi 为δi 的理想值。
定理1 对于式(4)的故障子系统模型,在假设1与假设2成立的前提下,采用式(15)~式(18)所示的参数更新律,可保证式(5)的滑模观测器的观测误差渐进收敛至零,即当t→∞,eij→0。
证明:构造如式(22)所示的正定Lyapunov函数
从以下两个步骤来对定理1的结论进行证明。
(1)将V1 对时间求导,可得
(2)将V2 对时间求导,可得
注意到ei2<ej2Ei<Ej,应用Chebyshev不等式[15],可得
定义估计误差为=δi-δi,将式(25)代入式(24),并结合式(21),可得
由步骤(1)与步骤(2)的结论可知<0,考虑到V≥0,<0,由Lyapunov稳定性理论可知0,考虑到eij是V 的函数,故limt→∞eij=0。定理1证毕。
为了使空间机器人在执行器发生部分失效故障情况下,系统输出轨迹仍然能够稳定地跟踪期望轨迹,本文设计了一种非奇异快速终端滑模分散容错控制律,可以有效改善系统的控制性能。
定义期望轨迹为qd=[θ0d θ1d … θnd]T,其中θid,θ·id与 θ··id(i=0,1,…,n)均为连续有界函数。状态xi1的跟踪误差为
式(27)对时间求导,可得
非奇异快速终端滑模面si设计为
式中,αi、βi 为正常数;ki、li、pi、qi 为正奇数,且满足1<pi/qi<2,ki/li>pi/qi。
式(29)对时间求导,并利用式(5)的第二式,可得
基于非奇异快速终端滑模的分散容错控制律设计如下:
式中,ζi与ηi为正常数。
由于1<pi/qi<2,ki/li>pi/qi,故式(31)的控制律不含任何负指数项,因此不存在计算奇异问题。
定理2 对于故障子系统模型(式(4)),设计分散滑模观测器(式(5)),应用终端滑模容错控制律(式(31)),可保证整个闭环系统渐进稳定,即当t→∞,εi→0。
证明:构造正定Lyapunov函数
式(32)对时间求导,可得
将式(31)代入式(33),可得
由此可见,当si≠0时,由于1<pi/qi<2,则0<pi/qi-1<1,考虑到βi>0,pi与qi为互质奇数,因此
(2)当εi=0,而εi≠0时,系统处于非稳定状态,可以证明系统不会一直保持在此状态(εi=0,εi≠0),而将渐进地抵达并保持在非奇异终端滑此时轨迹跟踪误差εi也会渐进收敛至零。
综上可知,闭环系统是渐进稳定的。定理2证毕。
值得注意的是,式(31)的控制器并不含有效因子,因此该控制器不需要了解执行器故障的具体信息,适合于所有执行器部分失效故障的容错控制。自适应神经网络减弱了传统控制算法对执行器故障下确界必须是已知的约束[6],便于工程实现。
为验证本文提出的分散容错控制律的有效性,对图1所示的平面空间机械臂系统进行数值仿真,取n=2。空间机器人的惯性参数为m0=40kg,m1=m2=3kg,l0=1.5m,l1=l2=3m,d1=d2=1.5m,J0=34kg·m2,J1=J2=1kg·m2。
对于前述RBF神经网络,选取基函数为高斯函数:
式中,xif,xig与xip为高斯函数的输入变量;cif,cig与cip为高斯函数的中心;bi为高斯函数的宽度。
选择神经网络参数为:输入变量xif=心cif,cig与cip随机地分布在区间[-2.5,2.5],宽度bi=2;神经网络隐层节点数为5。
采用以上的惯性参数与神经网络参数,针对常值型与随机时变型执行器失效故障进行仿真。仿真时考虑了空间机器人工作过程中最严重的一种故障情况,即所有执行器均发生部分失效故障。
常值型故障的有效因子ρi(i=1,2,3)可描述为[5]
控制器参数选取为pi=5,qi=3,ki=7,li=3,ki1=0.16,αi=18,βi=22,ζi=45,ηi=20;自适应增益系数选取为ηif=0.000 2,ηig=0.000 2,ηip=60,λi=5;载体与关节的期望轨迹选取为θ0d=cos(0.2πt)-1,θ1d =sin(0.2πt),θ2d =cos(0.2πt);系 统 初 始 运 动 位 置 为 q (0)=[0.1 0.2 0.8]T,xi1 (0)=0.5;初 始 速 度 为q·(0)=[0 0 0]T,xi2 (0)=0。仿 真 结 果 见图2。
由图2可知,在故障未发生时,尽管初始阶段存在一定跟踪误差,但由于容错控制器的作用,使得载体、关节1与关节2分别在2s、6s与1s内实现对期望轨迹的稳定跟踪,直至在故障发生时,仍能保持这种良好的跟踪性能。仿真结果表明所设计的控制器对常值型执行器故障的容错有效性。
随机时变型故障的有效因子ρi可描述为[6]
图2 轨迹跟踪曲线(常值型故障)
Fig.2 Trajectory tracking curves(constant faults)
式中,rand(1)表示为0至1之间的一个随机常数[6]。
控制器参数选取为pi=5,qi=3,ki=7,li=3,ki1=0.14,αi=25,βi=25,ζi=35,ηi=6;自适应增益系数选取为ηif=0.000 2,ηig=0.000 2,ηip=75,λi=2;载体与关节的期望轨迹选取为θ0d=sin(0.2πt),θ1d =cos(0.2πt)-1,θ2d =sin(0.2πt);系 统 初 始 运 动 位 置 为 q (0)=[-0.2 0.2 0.1]T;初 始 速 度 为 q· (0)=[0 0 0]T,xi2(0)=0。仿真结果见图3。
由图3可知,当执行器发生随机时变型失效故障时,尽管有效因子未知,但由于神经网络控制器对其具有良好的在线估计能力,能够及时消除失效故障对控制系统的影响,使得载体、关节1与关节2分别在6s、1s与3s内实现对期望轨迹的稳定跟踪。仿真结果表明所设计的控制器对于随机时变型执行器故障亦具有良好的容错能力。
图3 轨迹跟踪曲线(随机时变型故障)
Fig.3 Trajectory tracking curves
(stochastic time-varying faults)
本文针对执行器发生部分失效故障的空间机器人,提出了一种基于非奇异终端滑模的容错控制方法。利用分散神经网络对系统的执行器故障进行估计,根据估计结果在线设计控制律消除执行器失效故障对系统稳定性的影响,并通过数值仿真验证了控制方法的有效性与理论分析的正确性。
本文提出的控制方法具有以下优点:非奇异快速终端滑模避免了传统线性滑模的计算奇异现象;自适应神经网络减弱了传统容错控制方法中对执行器故障下确界必须是已知的约束;利用速度观测器对系统的速度信号进行了实时观测,可以一定程度上代替速度传感器,节省了载人航天的成本。该控制方法具有潜在的工程应用前景。
[1] 丁希仑,战强,解玉文.自由漂浮的空间机器人系统的动力学奇异特性分析及其运动规划[J].航空学报,2001,22(5):474-477.DING Xilun,ZHAN Qiang,XIE Yuwen.Dynamic Singularity Analysis and Motion Planning of Freefloating Space Robot Systems[J].Acta Aeronautica et Astronautica Sinica,2001,22(5):474-477.
[2] HUANG Panfeng,ZHANG Fan,CAI Jia,et al.Dexterous Tethered Space Robot:Design,Measurement,Control,and Experiment[J].IEEE Transactions on Aerospace and Electronic Systems,2017,53(3):1452-1468.
[3] 陈志勇,陈力.漂浮基带柔性铰空间机器人的动力学建模及奇异摄动控制研究[J].中国机械工程,2011,22(18):2151-2155.CHEN Zhiyong,CHEN Li.Study on Dynamics Modeling and Singular Perturbation Control of Freefloating Space Robot with Flexible Joint[J].China Mechanical Engineering,2011,22(18):2151-2155.
[4] LU Kunfeng,XIA Yuanqing,YU Chunmei.Finitetime Tracking Control of Rigid Spacecraft under Actuator Saturations and Faults[J].IEEE Transactions on Automation Science and Engineering,2016,13(1):368-381.
[5] SHEN Qiang,WANG Danwei,ZHU Senqiang.Robust Control Allocation for Spacecraft Attitude Tracking under Actuator Faults[J].IEEE Transactions on Control Systems Technology,2017,25(3):1068-1075.
[6] XIAO Bing,HU Qinglei,SHI Peng.Attitude Stabilization of Spacecrafts under Actuator Saturation and Partial Loss of Control Effectiveness[J].IEEE Transactions on Control Systems Technology,2013,21(6):2251-2263.
[7] 张丽娇,陈力.漂浮基柔性空间机械臂的模糊H"鲁棒控制及柔性振动最优抑制[J].中国机械工程,2016,27(18):2447-2452.ZHANG Lijiao,CHEN Li.Fuzzy Robust H"Control and Flexible Vibration Optimal Control for Free-floating Flexible Space Manipulator[J].China Mechanical Engineering,2016,27(18):2447-2452.
[8] 洪在地,贠超,陈力.柔性臂漂浮基空间机器人建模与轨迹跟踪控制[J].机器人,2007,29(1):92-96.HONG Zaidi,YUN Chao,CHEN Li.Modeling and Trajectory Tracking Control of a Free-floating Space Robot with Flexible Manipulators[J].Robot,2007,29(1):92-96.
[9] 王明,黄攀峰,孟中杰,等.空间机器人抓捕目标后姿态接管控制[J].航空学报,2015,36(9):3165-3175.WANG Ming,HUANG Panfeng,MENG Zhongjie,et al.Attitude Takeover Control after Capture of Target by a Space Robot[J].Acta Aeronautica et Astronautica Sinica,2015,36(9):3165-3175.
[10] 于潇雁,陈力.飘浮基两杆柔性空间机械臂基于速度观测器的增广自适应控制[J].振动与冲击,2017,36(11):176-182.YU Xiaoyan,CHEN Li.Velocity Observers-based Augmented Adaptive Control for a Free-floating Two-link Flexible Space Manipulator[J].Journal of Vibration and Shock,2017,36(11):176-182.
[11] 梁捷,陈力.执行器受限空间机器人的模糊神经网络控制[J].工程力学,2014,31(11):190-197.LIANG Jie,CHEN Li.Fuzzy Neural Network Control for a Space-based Robot with Constrained Actuators[J].Engineering Mechanics,2014,31(11):190-197.
[12] 谢立敏,陈力.具有柔性关节的漂浮基空间机械臂基于状态观测器的轨迹跟踪鲁棒反步控制及弹性振动抑制[J].机器人,2012,34(6):722-729.XIE Limin,CHEN Li.Robust Backstepping Control Based on State Observer and Elastic Vibration Suppressing of Free-floating Space Manipulator with Flexible Joints[J].Robot,2012,34(6):722-729.
[13] 叶柄能,陈力.时延估计柔性空间机器人鲁棒 H"控制及振动抑制[J].空间科学学报,2016,36(2):237-244.YE Bingneng,CHEN Li.Time Delay Estimation of Flexible Space Robot Robust H"Control and Vibration Suppression[J].Chinese Journal of Space Science,2016,36(2):237-244.
[14] LUCA M C,ANTONELLA F,ALEJANDRA F L,et al.Manipulator Fault Diagnosis via Higher Order Sliding-mode Observers[J].IEEE Transactions on Industrial Electronics,2012,59(10):3979-3986.
[15] 赵博,李元春.有效因子融合的可重构机械臂分散容错控制方法[J].清华大学学报(自然科学版),2012,52(9):1218-1222.ZHAO Bo,LI Yuanchun.Effectiveness Factor Integrated Decentralized Faults Tolerant Control Scheme for Reconfigurable Manipulators[J].Journal of Tsinghua University(Science&Technology),2012,52(9):1218-1222.
[16] FENG Yong,YU Xinghuo,MAN Zhihong.Nonsingular Terminal Sliding Mode Control of Rigid Manipulators[J].Automatica,2002,38:2159-2167.
Terminal Sliding Mode Fault-tolerant Control for Space Robots under Partial Loss of Actuator Effectiveness