民航发动机是航空飞行器的核心,提高设备可靠性,降低维修成本,建立以剩余寿命为核心的发动机健康管理(engine health management,EHM)技术成为现阶段航空业以及学术界的研究热点[1-3]。发动机剩余寿命预测是指通过分析发动机的历史性能退化过程,预测发动机衰退到失效阈值的剩余时间。现阶段寿命预测方法基本包括两类:基于物理失效模型的预测方法和数据驱动下的预测方法。针对民航发动机这种复杂的机械设备,由于缺乏原有的设计参数和控制规律,故很难得到其物理失效模型。快速存储记录器(quick access recorder, QAR)数据详细记录了飞行循环的多种状态参数,基于数据驱动的预测方法可以充分依靠发动机历史QAR数据来建立各种性能分析、寿命预测模型。
基于数据驱动的寿命预测最为常用的方法就是利用退化数据进行建模和回归预测。前期的研究中多以单性能参数为数据源建立发动机性能退化模型,其中Winner过程[4-5]能够较好地描述性能退化过程的随机性,在相关的研究中较为常用; PAN等[6]则通过逆高斯模型,得到较好的预测结果。WANG等[7]通过核递归最小二乘法模型预测发动机的剩余寿命;随着机器学习研究的深入,ZHOU 等[8]将支持向量机(support vector machine,SVM)运用到寿命预测问题中,使预测精度进一步提高。实际生产过程中,即使是同型号发动机之间也会存在出厂制造差异,使用过程中存在维修水平差异、飞行环境差异等,造成发动机衰退轨迹不完全相同。显然,预测过程如何体现个体差异性是准确预测的核心和难点问题。
基于退化轨迹相似性[9-11]的方法是较好解决个体差异的寿命预测方法,其核心思想是两个样本前期退化轨迹的相似度越高,则当前时刻之后的剩余寿命相似概率越大。可以建立历史寿命数据库,通过与库中的样本进行相似度匹配来预测当前样本的剩余寿命。当拥有足够的历史寿命样本时,相似度算法的预测效果将普遍优于其他基于数据驱动的预测方法。例如,针对航空发动机,WANG[9]以美国国家航空航天局(national aeronautics and space administration,NASA)提供的C-MAPSS仿真数据为数据源进行相似度算法寿命预测,其结果优于神经网络方法的预测结果;针对机械设备,申中杰等[10]提出一种基于相似特征和多变量支持向量机的方法来预测机械设备轴承剩余寿命;针对电子产品的寿命预测问题,邓森等[11]通过对K值聚类之后的退化轨迹进行相似度计算,并通过加权获得待测样本的退化轨迹,从而实现有效的寿命预测。
上述基于相似度的研究虽然考虑了发动机个体间的差异性,但都是针对单一性能参数,同时也没有考虑相似度算法的敏感性。多种性能参数能够更全面地表征发动机健康状态,针对多参数寿命预测,就是将多种性能参数融合为综合指标,再利用不同的预测方法进行寿命预测。本文以航空公司发动机实际监测数据为数据来源,基于改进的预测方法进行寿命预测。利用ReliefF-PCA算法将多维性能参数融合为表征发动机性能状态的健康指数;计算健康指数的相似度,并对相似度度量算法进行敏感性修正,提高算法在衰退趋势以及初始衰退状态的敏感度;应用航空公司的实际发动机数据,用改进的预测方法进行寿命预测,并与基准相似算法预测结果以及真实剩余寿命进行比较,来验证改进预测方法的优越性。
基于多退化参数相似融合的剩余寿命预测方法的主要流程如图1所示,从发动机性能退化轨迹出发,对历史样本与当前样本进行相似性计算,然后融合所选中相似样本的剩余寿命预测当前样本的剩余寿命。
图1 基于多退化参数相似融合的剩余寿命预测
Fig.1 Residual life prediction based on multi-degradation parameter similarity fusion
民航发动机是一个复杂的机电液磁耦合系统,单独利用某一个监测参数不能很好地表征发动机的性能状态,需要将多种监测参数进行融合,充分提取所有监测参数中的退化特征信息,进而准确预测发动机的剩余寿命。本文采用ReliefF算法进行特征筛选,并通过主成分分析(PCA)方法对筛选后的监测参数进行融合,得到表征发动机健康状态的多参数融合指标。
ReliefF算法是由KONONENKO[12]提出的一种特征权重算法,通过区分相互靠近样本的能力对特征的有效性进行评价。使用该算法可以对多种发动机状态参数进行筛选,得到与发动机性能衰退有较大相关关系的性能参数。
假设发动机历史性能退化数据经历了E个样本点,性能退化参数有M维。其中,在飞行循环数ti处的监测值xi由M维性能监测参数构成,即xi=(xi,1,xi,2,…,xi,M)T,而每一维性能参数都是长度为E的时间序列。基于ReliefF算法的退化参数筛选首先要从连续的时间序列数据中区别不同类别的样本空间。本文按照性能参数的退化程度对数据空间进行分类,早期的监测数据为退化程度较低的一类,末期监测数据为退化程度较高的一类。
采用ReliefF算法对目标值为连续值的数据筛选退化参数,退化参数的权重越大,表示该参数在整机退化中的比重越大,反之,比重小。假设D为历史样本集,M为监测参数量,两个监测点xi和xj的第z个性能参数差异为
dis(xi,z,xj,z)=(xi,z,xj,z)/sz
(1)
其中,xi,z为第i个监测点的第z个性能参数,sz为第z个特征的标准化单位。ReliefF算法具体步骤如下。
(1)确定算法样本集K和特征值F,并对迭代次数n以及选取的领域样本个数k进行初始化。
(2)从选定的样本集中随机取出样本R,从与R属于同一类样本中选取k个近邻点记作Rj,从与R不属于同类型的样本中选取k个近邻点记作Fj(C),并重复执行到规定迭代次数。
(3)计算各参数的权重矩阵:
(2)
式中,p(C)为类别C出现的概率。
(4)将步骤(3)重复M次得到参数的权重矩阵W,并按照权重大小重新排序。
这里的特征权重阈值r=avg(w),通过算法可以筛选得到m个监测参数,得到新的发动机状态特征集F={f1,f2,…,fm},新的特征集更为简洁,同时也能很好地表征发动机性能退化状态。
通过ReliefF算法可从众多的监测参数中筛选出与发动机性能衰退最相关的参数,但各参数之间可能会存在一定的相关性,因此,需要通过PCA算法降低筛选后的性能参数之间的相关性,并通过相应的权重赋值,得到表征发动机性能状态的新的参数——健康指数。PCA算法是通过正交变换将多个可能存在相关性的变量转换为少数几个线性不相关的主成分[13],转换后的主成分不仅保留了原始数据的主要内容,而且消除了不同特征值之间的相关性影响。
假设经过ReliefF算法特征筛选后发动机历史退化数据F包括m维性能监测参数,即F=(f1,f2,…,fm)T∈RtE×m,fi={f1,f2,…,ftE}表示第i个性能参数所对应的时间序列数据,PCA算法对m维监测参数提取主成分并进行健康指数融合的具体步骤如下。
(1)对数据矩阵F进行标准化处理(均值归0,方差归 1),标准化处理后矩阵为F*。
(2)求F*对应协方差矩阵(矩阵长度为m m维)的特征值λi(i=1,2,…,m)和特征向量。
(3)将特征值λi降序排列,即λ1≥λ2≥…≥λm,并计算添加不同数量监测参数下累计贡献率要求累计贡献值阈值θτ=90%,取超过阈值时前P个特征值对应的特征向量按顺序组成特征向量矩阵矩阵长度为tE×P)。
(4)将F*投影在降维后的主成分X的计算公式为
(3)
其中,X定义为原始数据F的主成分元素,y1,y2,…称为第一主成分、第二主成分…;由式(3)可知,算法最终所保留的前P个主成分是原始数据在上的投影,即能够很好表征发动机退化程度的转换后参数的线性组合结果,它既保留了原始数据的绝大多数特征信息(阈值取90%以上),并且特征之间彼此不相关,称为正交退化特征。为了减少性能参数值域影响,同时便于之后的相似度计算,进一步提高数据的简洁性,需要通过离差标准化对性能参数进行归一化处理,并通过参数融合将多种性能参数融合为单一性能指标——发动机健康指数Ii,其计算公式为
(4)
(5)
其中,ρj为降维后P个性能参数的权重值;为进行离差标准化后的参数值,其计算公式为
(6)
式中,xmax、xmin分别为对应性能参数数据中的最大值、最小值。
相似度计算是以发动机的性能退化轨迹作为输入,用某种度量方法定量刻画两条退化轨迹的相似程度/距离,并以该相似程度为基础,寻找与当前样本相似的时间序列。常见的计算时间序列相似度算法有欧氏距离法、动态时间弯曲距离法(dynamic time warping,DTW)等[14],由于欧氏距离法具有普遍适用、计算速度快的特点,本文采用欧氏距离计算时间序列之间的相似度。将发动机的性能衰退过程划分成两个阶段[15]:性能平稳阶段和性能衰退阶段,如图2所示。为提高相似度度量方法对衰退趋势的敏感度,需要对欧氏距离进行趋势敏感处理。
图2 分段性能退化过程
Fig.2 Piecewise performance degradation process
假设长度为n的待测发动机的健康指数时间序列为I{I1,I2,…,In},各监测点所对应的退化趋势为I′{I′1,I′2,…,I′n},待测样本所对应的平均衰退率为Favg,对退化过程进行分阶段的敏感性处理,改进后的相似度δtot计算公式为
Favg=(In-I1)/n
(7)
δtot=δcon(i,j)+δlin(i,j)
(8)
(9)
其中,δcon(i,j)是发动机性能平稳阶段的相似度;δlin(i,j)是发动机性能衰退阶段的相似度;r(j,i)是第j条历史退化时序中所对应的第i个记录点。通过对相似度计算进行敏感性修正,能够增加趋势变化剧烈部分的权重,提高算法对发动机退化趋势的敏感性,实现更好的预测效果。
对于待测样本,其退化轨迹的性能衰退阶段的起始点与历史样本轨迹对应点并不完全相同,并且之后的性能衰退趋势也有不同,所以需要考虑时域状态对相似度度量算法的影响。本文通过对待测样本进行平移处理,寻找趋势匹配的最佳位置点,提高算法的时域敏感度,增强算法的预测精度,示意图见图3。
图3 基于时域敏感性的平移处理
Fig.3 Translation processing based on time domain sensitivity
假设待测发动机的健康指数时间序列为I{I1,I2,…,In},在遍历历史样本轨迹时,首先要判断与历史样本序列性能平稳阶段所经历的时间长短:若待测发动机时序的平稳段区间小于历史样本,则将待测发动机健康指数序列从左至右进行滑动平移;若待测发动机时序的平稳段区间大于历史样本,则将待测发动机健康指数序列从右往左进行滑动平移。为寻求最佳匹配点,每次滑动距离都要以一个监测点为单位。在每一次滑动后计算待测发动机样本健康指数时间序列I与历史样本健康指数序列IHi之间的改进相似度δtot(I,IHi),当滑动距离为m步时,判断δtot(I,IHi)|m满足
(10)
时的滑动距离m即最佳滑动距离,并计算得到当前样本的剩余飞行循环数
Rre=THi,end-Tend
(11)
其中,THi,end为所选历史样本健康指数序列的下发飞行循环数,Tend为当前样本滑动后对应的飞行循环数。当完成测试样本与历史库中一条退化轨迹的相似度计算,得到对应的剩余飞行循环数Rre后,还需要重复上述平移过程,直至与寿命库中所有历史轨迹完成相似度计算。
为了使寿命预测的结果具有更全面的适应性,测试样本的剩余寿命是选择与测试样本最为相似的5组历史轨迹的相似度计算结果加权融合得到的,最终得到所求的剩余寿命。本文采用斯皮尔曼系数法[16]确定各结果的相似程度并分配权重以提高算法的预测精度,其剩余寿命的计算公式为
(12)
其中,h表示所需发动机历史样本数;为权重,具体的权重计算方法如下:
(13)
式中,δtot(I,IHi)i为当前样本与第i个历史样本的相似度。
为验证本文方法的有效性,采用国内某航空公司某型发动机机队QAR数据、可靠性月报以及换发记录。利用按照稳态报文提取条件[17]以及起飞排气温度裕度(exhaust gas temperature margin,EGTM)提取条件[18]从QAR数据中所得到的发动机历史监测数据,并根据飞机的可靠性月报以及换发记录,得到发动机对应飞行循环数下的各性能参数数据。通过整理得到机队各发动机的性能参数数据,部分数据见表1,包括56台发动机两次大修间隔之间的各飞行循环下9个维度性能参数:起飞排气温度裕度MEGT,燃油流量偏差值ΔF,低压转子转速偏差值ΔN1,高压转子转速偏差值ΔN2,风扇入口压力p1,燃烧室入口压力p3,日均滑油消耗量Qoil, 低压转子振动值VN1,高压转子振动值VN2,还包括气路参数和机械参数(低压转子振动值VN1,高压转子振动值VN2、日均滑油消耗量),将前50台发动机作为历史样本库数据,最后6台发动机作为算法测试样本。以测试样本的前1 500飞行循环各性能参数作为已知数据点,进行剩余寿命预测并与真实的剩余飞行循环数进行对比。
表1 整理所得的发动机各性能参数
Tab.1 The degradation parameters of the engine
序号参数类别飞行循环数12…754755…3 8553 8564***1起飞排气温度裕度(℃)43.7843.79…35.4735.44…5.445.39燃油流量偏差值0.891.37…1.811.52…2.102.15……………………高压转子转速偏差值1.371.32…1.761.79…1.321.294***2起飞排气温度裕度(℃)35.0635.71…30.6129.97…燃油流量偏差值1.381.40…1.891.88……………………高压转子转速偏差值1.211.12…1.571.47…︙︙4**56起飞排气温度裕度(℃)47.0748.61…37.0336.72…燃油流量偏差值-2.55-2.03…-1.27-1.18……………………高压转子转速偏差值1.191.25…1.721.73…
本文采用改进预测算法对测试样本进行剩余寿命预测(将文献[9]中未进行敏感性修正的相似性算法称为基准相似算法),并将预测结果与基准相似算法得到的预测结果、待测样本的真实剩余寿命进行对比。为确定多参数融合的效果,也利用基准相似算法对单参数进行了预测,选择现阶段较为常用的单性能参数EGTM值[19]作为退化指标,并将预测结果一同进行对比分析。
图4 性能参数权重
Fig.4 Health parameter weight
发动机历史性能参数数据包含9种性能参数,采用ReliefF算法筛选出与发动机性能衰退密切相关的退化特征参数,通过计算得到各性能参数的权重值分布,如图4所示。图4中虚线即特征权重阈值,保留的性能参数为MEGT、ΔF、ΔN1、ΔN2。由筛选结果可以发现:本文所用到的数据中,发动机各转子振动值以及日均滑油消耗量随飞行循环数并没有明显的退化趋势,虽然它们在发动机状态监控方面有着很高的应用价值,但是与性能的衰退相关性不大,不满足权重阈值要求,所以被筛掉。
对保留的性能参数进行PCA变换,得到能够较好表征发动机退化状态的主成分,当累计贡献率θτ=90%时,保留得到前3个主成分。通过权重分配以及离差标准化,得到各发动机健康指数,其中4台发动机的健康指数退化轨迹如图5所示。
图5 部分发动机健康指数退化轨迹
Fig.5 Partial engine health index degradation trajectory
将选中的6台待测发动机样本前1 500飞行循环数据点作为测试样本,基于本文提出的改进预测算法对测试样本进行剩余寿命预测。通过敏感性修正后的相似度度量算法遍历样本库中的发动机样本,并选择与测试样本相似程度最高的5台发动机历史样本轨迹,其中1台测试样本与遍历得到的与其相似度最大的5台历史样本轨迹如图6所示。最终通过相应的权重分配,可以得到测试样本的剩余寿命预测结果。
图6 改进预测算法的部分发动机健康指数退化轨迹
Fig.6 Improved prediction algorithm result diagram
为验证本文建立方法的有效性,需要利用不同方法对同样的测试样本进行训练:①以单性能参数MEGT为数据源,利用基准相似算法对测试样本预测剩余寿命;②以融合后的健康指数为数据源,采用基准相似算法进行剩余寿命预测;③采用本文提出的改进预测方法进行预测。最终,对6台发动机进行寿命预测,将3种预测方法得到的预测结果与真实值进行对比,预测结果对比见表2。其中,RSC为测试样本的真实剩余飞行循环,SU_RSC为基于单参数基准相似算法的预测值,MU_RSC为基于健康指数基准相似算法的预测值,MI_RSC为本文所采用的改进寿命预测算法得到的预测值,Δωi 为不同方法的预测误差。
表2 预测结果对比
Tab.2 Comparison of forecast results
RSCSU_RSCΔω1MU_RSCΔω2MI_RSCΔω312 3382 2264.79%2 3982.57%2 3021.54%22 8663 0094.99%2 9472.83%2 8261.40%33 1362 9854.82%3 1981.98%3 1931.82%43 2213 1751.43%3 2681.46%3 2581.15%53 7843 6812.72%3 7111.93%3 8110.71%62 6842 5106.48%2 7382.01%2 7121.04%
对比表2的预测结果可以看出:①基于改进寿命预测算法得到的预测结果十分接近测试样本的真实剩余飞行循环数,有很好的预测精度,证明了本文所建立方法的可靠性;②基于单参数基准相似算法得到的预测误差高于其余2种预测方法的预测误差,表明融合得到的健康指数能够较好地表征发动机的健康状态,特别是基于参数敏感性的特征融合,能够有效地减少方法的预测误差;③同时以健康指数为数据源的两种方法,改进寿命预测方法相比基准相似算法的预测精度得到了进一步的提高,表明改进寿命预测算法能够进一步优化基准相似算法,也表明本文针对相似度度量的敏感性优化处理具有实际应用价值,有效提高了算法的预测精度。
本文提出了一种基于多参数融合相似的寿命预测方法。采用ReliefF-PCA算法对多种监测参数筛选后融合为表征发动机退化状态的健康指数,提高了算法的参数敏感性;对发动机不同衰退阶段的相似度度量算法进行分段处理,提高了算法的趋势敏感性;将待测样本的轨迹进行平移处理,提高相似度度量匹配性,增强算法的时域敏感性。最后,通过利用实际机队中的发动机历史监测数据,对比验证本文所建立方法的有效性,结果表明改进后的预测方法在提高数据利用率的同时,能够进一步提高算法的敏感性和预测精度。
[1] 尉询楷,刘芳,陈良峰,等.航空发动机健康管理用户的诊断预测指标体系[J].航空发动机,2012,38(5):27-35.
WEI Xunkai, LIU Fang,CHEN Liangfeng,et al.Diagnostic and Prognostic Metrics of Aeroengine Health Management Users[J].Aeroengine,2012,38(5):27-35.
[2] 王华伟, 吴海桥. 基于信息融合的航空发动机剩余寿命预测[J].航空动力学报, 2012, 27(12):2749-2755.
WANG Huawei, WU Haiqiao.Residual Useful Life Prediction for Aircraft Engine Based on Information Fusion[J].Journal of Aerospace Power,2012, 27(12):2749-2755.
[3] 彭宝华, 周经伦, 孙权, 等. 基于退化与寿命数据融合的产品剩余寿命预测[J]. 系统工程与电子技术, 2011, 33(5):1073-1078.
PENG Baohua, ZHOU Jinglun, SUN Quan, et al.Residual Life Prediction of Products Based on Fusion of Degradation Data and Lifetime Data[J].Systems Engineering and Electronics,2011,33(5):1073-1078.
[4] 朱磊, 左洪福, 蔡景. 基于Wiener过程的民用航空发动机性能可靠性预测[J]. 航空动力学报, 2013, 28(5):51-57.
ZHU Lei, ZUO Hongfu, CAI Jing.Performance Reliability Prediction for Civil Aviation Aircraft Engine Based on Wiener Process[J].Journal of Aerospace Power,2013, 28(5):51-57.
[5] WANG X , BALAKRISHNAN N , GUO B . Residual Life Estimation Based on a Generalized Wiener Degradation Process[J].Reliability Engineering & System Safety, 2014, 124:13-23.
[6] PAN D , LIU J B , CAO J . Remaining Useful Life Estimation Using an Inverse Gaussian Degradation Model[J]. Neurocomputing, 2016, 185(12):64-72.
[7] WANG P, YOUN B D, HU C. A Generic Probabilistic Framework for Structural Health Prognostics and Uncertainty Management[J]. Mechanical Systems and Signal Processing, 2012, 28:622-637.
[8] ZHOU H , HUANG J, LU F.Reduced Kernel Recursive Least Squares Algorithm for Aero-engine Degradation Prediction[J].Mechanical Systems and Signal Processing, 2017, 95:446-467.
[9] WANG T. Trajectory Similarity Based Prediction for Remaining Useful Life Estimation[J]. Dissertations & Theses - Gradworks, 2010,230(3):208-234.
[10] 申中杰, 陈雪峰, 何正嘉,等. 基于相对特征和多变量支持向量机的滚动轴承剩余寿命预测[J]. 机械工程学报, 2013, 49(2):183-189.
SHEN Zhongjie, CHEN Xuefeng, HE Zhengjia, et al.Remaining Life Predictions of Rolling Bearing Based on Relative Features and Multivariable Support Vector Machine[J].Journal of Mechanical Engineering,2013, 49(2):183-189.
[11] 邓森, 景博, 周宏亮. 基于灰色时序组合模型的产品实时寿命预测方法[J]. 系统工程与电子技术, 2014, 36(4):802-808.
DENG Sen, JING Bo, ZHOU Hongliang. Real-time Lifetime Prediction Method for Products Based on Grey Time Series Combined Forecasting Model[J].Systems Engineering and Electronics,2014, 36(4):802-808.
[12] KONONENKO I.Estimating Attributes: Analysis and Extension of Relief[C]∥European Conference on Machine Learning.Berlin,1994:72-198.
[13] 张妍,王村松,陆宁云,等.基于退化特征相似性的航空发动机寿命预测[J].系统工程与电子技术,2019,41(6):1414-1421.
ZHANG Yan, WANG Cunsong,LU Ningyun,et al. Remaining Useful Life Prediction for Aero-engine Based on the Similarity of Degradation Characteristics[J].Systems Engineering and Electronics, 2019,41(6):1414-1421.
[14] 李中, 刘洋洋, 张铁峰. 基于形态相似距离的时间序列相似度计算[J]. 计算机工程与设计, 2016, 37(3):679-683.
LI Zhong, LIU Yangyang, ZHANG Tiefeng.Time Series Similarity Measurement Based on Morphology Similarity Distance[J].Computer Engineering and Design,2016, 37(3):679-683.
[15] WANG T , YU J , SIEGEL D, et al. A Similarity-based Prognostics Approach for Remaining Useful Life Estimation of Engineered Systems[C]∥International Conference on Prognostics & Health Management. New York, 2008:37-42.
[16] YOU Mingyi,GUANG Meng, et al. A Predictive Maintenance Scheduling Framework Utilizing Residual Life Prediction Information[J]. Proceedings of the Institution of Mechanical Engineers, Part E: Journal of Process Mechanical Engineering, 2013,227(3):185-197.
[17] 郝英. 发动机起飞EGT裕度的估算[J]. 航空维修与工程, 2004(2):39-40.
HAO Ying.Estimation of Aero-engine Takeoff EGT Margin[J].Aviation Maintenance & Engineering,2004(2):39-40.
[18] 曹惠玲, 周百政. QAR数据在航空发动机监控中的应用研究[J]. 中国民航大学学报, 2010, 28(3):15-19.
CAO Huiling, ZHOU Baizheng.Application Research of QAR Data on Aero-engine Monitoring[J].Journal of Civil Aviation University of China,2010, 28(3):15-19.
[19] 付旭云, 钟诗胜, 张慕楠. 一种改进的航空发动机剩余寿命预测方法[J]. 哈尔滨工业大学学报, 2013, 45(5):51-55.
FU Xuyun, ZHONG Shisheng, ZHANG Munan. An Improved Method for Aeroengine Residual Life Prediction[J].Journal of Harbin Institute of Technology,2013, 45(5):51-55.