技术中心
 
 

故障预测与健康管理(PHM)技术的现状与发展

   日期:2016-01-19    
核心提示:现代武器装备的采购费用和使用与保障(O&S)费用日益庞大,经济可承受性成为一个不可回避的问题。据美军综合数据,在武器装备的全寿命周期费用中,使用与保障费用占到了总费用的72%。与使用保障费用相比,维修保障费用在技术上更具有可压缩性。PHM、基于状态的维修(CBM)、货架产品(COTS)、自主保障(AL)等都是压缩维修保障费用的重要手段 。

1. 引言

现代武器装备的采购费用和使用与保障(O&S)费用日益庞大,经济可承受性成为一个不可回避的问题。据美军综合数据,在武器装备的全寿命周期费用中,使用与保障费用占到了总费用的72%。与使用保障费用相比,维修保障费用在技术上更具有可压缩性。PHM、基于状态的维修(CBM)、货架产品(COTS)、自主保障(AL)等都是压缩维修保障费用的重要手段 。

从20世纪70年代起,故障诊断、故障预测、CBM、健康管理等系统逐渐在工程中应用。70年代中期的A-7E飞机的发动机监控系统(EMS)成为PHM早期的典型案例。在30年的发展过程中,电子产品机上测试(BIT)、发动机健康监控(EHM)、结构件健康监控(SHM)、齿轮箱、液压系统健康监控等具体领域问题的PHM技术得到了发展,出现了健康与使用监控系统(HUMS) 、集成状态评估系统(ICAS)、装备诊断与预计工具(ADAPT) 等集成应用平台,故障诊断、使用监测、与维修保障系统交联是这些平台具有的典型特征,但故障预测能力和系统集成应用能力很弱或没有。例如, ICAS正在提升其故障预测能力、开放式系统集成能力,更好地满足系统级集成应用的需求。

工程应用及技术分析表明,PHM技术可以降低维修保障费用、提高战备完好率和任务成功率:

通过减少备件、保障设备、维修人力等保障资源需求,降低维修保障费用;

通过减少维修,特别是计划外维修次数,缩短维修时间,提高战备完好率;

通过健康感知,减少任务过程中故障引起的风险,提高任务成功率。

本文在阐述PHM概念及其框架的基础上,依据故障诊断与预测的人机环完整性认知模型,对故障诊断与故障预测技术进行了分类与综合分析;分析了故障诊断与预测技术的性能要求、定量评价与验证方法;清理了PHM技术的发展方向。

2. PHM的系统级应用

PHM系统一般应具备故障检测、故障隔离、增强的诊断、性能检测、故障预测、健康管理、部件寿命追踪等能力,通过联合分布式信息系统(JDIS)与自主保障系统交联。联合攻击战斗机(JSF)的PHM系统分为机上与地面两部分。机上部分,包括推进系统、任务系统等若干个区域管理者(AM),完成子系统、部件性能检测,增强的故障诊断,实现关键系统与部件的故障预测等任务。例如,推进系统区域管理者(AM)就集成了吸入碎片监控(IDMS)、发动机微粒监控(EDMS)、涡流叶片监控(ECBS)、滑油微粒监控(ODM)等功能。

大多数故障诊断与故障预测工具都具有领域相关的特点。采用开放式的体系结构(OSA),方便各种故障诊断与预测方法的不断完善,实现即插即用,成为了在系统级实现PHM的一项关键技术 。

 


典型的故障诊断与预测流程(图1)包含了数据采集、数据预处理、数据传输、特征提取、数据融合、状态监测、故障诊断、故障预测、保障决策等环节。数据的采集与传输,目前的发展体现在传感器的高精度、小型化、集成化、严酷环境适应性、可靠性(应比被监测对象更可靠)、低能耗,健壮与高速率传输的传感器网络等方面,本文不再论述;在后文中主要集中在特征提取与数据融合、故障诊断与预测推理、以性能评价及保障决策等方面,对PHM技术的发展进行分析。

3. 故障诊断与预测技术的分类与分析

3.1 故障诊断与预测的认知模型

故障是产品不能完成规定功能或性能退化不满足规定要求的状态。故障诊断与预测都是对客观事物状态的一种判断,其最基本的出发点是判断者采信的信息源。客观事物的发展存在内因与外因两个方面,观察者、被观察对象、观测的环境构成了故障诊断与预测的完整认知模型(图2)。采信的信息源不同,构成了不同的故障诊断与预测方法论。对于故障诊断与故障预测来说,可以采信的信息源包括:

被观测对象直接的功能及性能信息(基于故障状态信息);

被观测对象使用中表现出来的异常现象信息(基于异常现象信息);

被观测对象使用中所承受的环境应力和工作应力信息(基于使用环境信息);

预置损伤标尺(precursor)的状态信息(基于损伤标尺信息)。

 

关于故障诊断与故障预测方法的分类,目前尚不统一,"基于经验、基于趋势、基于模型"、""基于数据、基于模型"等分类方法可以见诸文献。本文从故障诊断与故障预测的认知模型出发,依据采信的信息源不同对众多的故障诊断与故障预测方法进行归类分析,以期形成故障诊断与故障预测技术发展的完整图像。

3.2 基于故障状态信息的故障诊断与预测

直接采信被观测对象功能及性能信息进行故障诊断,是置信度最高的故障诊断方法,得到了最成功的应用。典型的方法包括电子产品的机上测试(BIT),以及非电子产品功能系统的故障诊断等。本文对具体方法不作说明。

虚警率(FA)高或不能复现(CND)故障多是困扰BIT的一个主要问题。以航空电子为例,美国F/A-18C飞机1996-1998年统计,虚警率高达88%,平均虚警间隔飞行时间(MFHBFA)不到1小时。

造成BIT虚警率高的原因,除了BIT系统本身的设计问题外,主要表现为不可复现(CND)或重测合格(RTOK)等状态。CND状态出现的原因一直是近年研究的热点,有专家认为,由于机上与地面工作应力和环境应力的不同,以及拆装过程的影响,使得机上测试状态与地面复测状态存在差异,是导致CND和虚警的一个主要原因。与使用环境数据等进行融合,进行综合诊断,成为提高BIT能力的重要途径。

另外,实验证明环境应力对电子产品造成的某些累积损伤也表现为电性能的退化,在现行BIT体系的基础上,采集电性能退化信息,有可能实现对电子产品的故障预测。

3.3 基于异常现象信息的故障诊断与故障预测

通过被观测对象在非正常工作状态下所表现出来或可侦测到的异常现象(振动、噪声、污染、温度、电磁场等)进行故障诊断,并基于趋势分析进行故障预测。大多数机械产品由于存在明显的退化过程,多采用这种故障诊断与预测方式。

基于异常现象信息进行故障诊断与故障预测的一个主要问题是异常信息往往被正常工作噪声所掩盖。例如,采用振动或噪声分析手段对直升机齿轮箱进行故障诊断与预测时,状态异常(轮齿磨损)引起的振动载荷变化可能只有1/4G,而正常工作振动载荷可能达到1000G,信噪比为1:4000。另一个问题是异常现象是宏观的系统级的,而故障原因却是部件级、材料级的,一种现象常存在多种可能的原因,导致故障定位困难。

基于异常现象信息进行故障诊断与故障预测的任务是:基于历史统计数据、故障注入获得的数据等各类已知信息,针对当前产品异常现象特征,进行故障损伤程度的判断及故障预测(图3)。概率分析方法、人工神经网络、专家系统、模糊集、被观测对象物理模型等都可以用于建立异常现象与故障损伤关系模型。

 

概率趋势分析模型

此类方法通过异常现象对应的关键参数集,依据历史数据建立各参数变化与故障损伤的概率模型(退化概率轨迹),与当前多参数概率状态空间进行比较,进行当前健康状态判断与趋势分析。通过当前参数概率空间与已知损伤状态概率空间的干涉来进行定量的损伤判定,基于既往历史信息来进行趋势分析与故障预测。

概率趋势分析模型已用于涡轮压缩机气道等的故障预测,主要监控效率、压缩比、排气温度、燃油流量等四个参数。图4为双参数状态空间下,压缩机健康状态演化图,2%及4%的点代表了已知的相应损伤的概率空间,椭圆为概率分布等高线。

 

神经网络(ANN)趋势分析模型

此类方法利用ANN的非线性转化特征,及其智能学习机制,来建立监测到的故障现象与产品故障损伤状态之间的联系。利用已知的“异常特征-故障损伤”退化轨迹,或通过故障注入(seeded fault)建立与特征分析结果关联的退化轨迹,对ANN模型进行“训练/学习”;然后,利用“训练/学习”后的ANN依据当前产品特征对产品的故障损伤状态进行判断。由于ANN具有自适应特征,因此可以利用非显式特征信息来进行“训练/学习”与故障损伤状态判断。

基于系统模型进行趋势分析

此类方法利用建立被观测对象动态响应模型(包括退化过程中的动态响应),针对当前系统的响应输出,进行参数辨识,对照正常状态下的参数统计特性,进行故障模式确认、故障诊断和故障预测(图5)。这种方法提供了一种不同于概率趋势分析、ANN的途径,具有更高的置信度和故障早期预报能力。

 


例如, 针对机电式作动器(EMA)进行故障预测时,基于MATLAB建立EMA动态仿真模型,采用干摩擦系数(FDC)、局部齿轮硬度(LGS)、扭矩常数(TC)、电机温度(MT)作为关键参数进行故障预测。FDC变化对作动筒响应的影响如图5所示。

3.4 基于使用环境信息的故障预测

由于电子产品尚无合适的可监测的耗损参数和性能退化参数、故障发生进程极短(毫秒级)等原因 ,电子产品的寿命预测一直是一个难点。由美国马里兰大学CALCE ESPC提出的电子产品"寿命消耗监控(LCM)"方法论是目前主要发展方向。LCM方法论(图6)采信的是环境信息,基于电子产品的失效物理模型,通过环境应力和工作应力监测,进行累计损伤计算,进而推断产品的剩余寿命。

 

LCM方法论的基础是对产品对象失效模式、失效机理的透彻了解,并建立量化的失效物理模型。电子产品(特别是电子元器件)的失效物理研究已有40年的历史,积累了丰富的模型,典型的模型包括焊点疲劳、电迁移、热载流子退化、时间相关介电质击穿(TDDB)、锡须、导电细丝形成(CFF)等[28]。

LCM方法论已用于航天飞机火箭助推器电子组件、航天飞机远距离操作系统(SRMS)电子组件、JSF飞机电源开关模块和DC/DC转换器、航空电源等的寿命预测,取得了良好的效果。LCM方法论事实上也适用于机械产品,目前已尝试在美军轮式地面车辆、直升飞机齿轮箱中的正齿轮和蜗杆等机械产品中应用。

3.5 基于损伤标尺的故障预测

所谓损伤标尺(precursor),是针对一种或多种故障机理,以被监控产品相同的工艺过程制造出来的、预期寿命比被监控对象短产品。

基于对被监控对象特定失效机理的认识,损伤标尺可以做到定量设计。通过一系列不同健壮程度的损伤标尺,可以实现电子产品损伤过程的连续定量监控,解决LCM方法累计损伤程度难以证实的问题。

基于损伤标尺的故障预测可以在器件内和电路板级进行。器件内的损伤标尺,目前已有商业化的产品。针对静电损伤(ESD)、TDDB、电迁移、热载流子、辐射损伤等失效机理,做到了在宿主器件剩余20%寿命时失效。目前国外军品器件大量断档的现实,为器件内的损伤标尺开辟了更大的应用空间。内建损伤标尺的器件,同时也是电路板组件的损伤标尺。

3.6 数据融合及综合诊断与预测

综合利用来自多种信息源的、多参数、多传感器信息,以及历史与经验信息,以减小故障诊断与预测的差错,提高置信度,是数据融合的根本任务。

故障诊断与预测中的数据融合可以在三个层次进行:①传感器层融合,没有信息丢失,但传输与计算量大;②特征层融合,特征提取时有信息丢失。③推理层融合。典型的数据融合过程(图1)包括在特征层融合时采信传感器层的关键原始数据,推理层融合时采信相似产品可靠性统计数据或专家经验知识。

数据融合时要考虑的主要问题是各种来源的信息的可信程度/精确度是不一样的,不恰当的数据融合也会导致故障诊断与预测的置信度降低。常用的数据融合方法有权重/表决、贝叶斯推理、Dempster-Shafer、卡尔曼滤波、神经网络、专家系统、模糊逻辑等方法。

当前大量的应用案例都采用了数据融合的综合诊断与预测方法。例如,采用卡尔曼滤波方法对机械传动的振动数据进行融合、采用自动推理对齿轮箱的振动数据与油液污染数据进行融合、采用权重方法和贝叶斯推理方法对监控直升飞机传动系的多加速度传感器数据进行融合等。图7为采用ANN融合齿轮箱领域专家知识与振动监测数据、试验台数据的方法,应用于齿轮箱健康监控,提高了对初期故障的预测置信度。

 


需要强调的是,对于采用LCM方法的电子产品故障预测,更需要采用数据融合的方式提高预测的置信度。此类研究目前未见报道。

4. 故障诊断与预测技术的性能要求、评价与验证

由于产品内部特性(结构尺寸、材料特性等)、外界应力、量化故障规律、观测数据等的不确定性,导致了故障诊断与预测的不确定性,产生了PHM技术的性能评价与验证问题。

4.1 故障诊断与预测的性能要求

故障检测与预测的置信度是随着损伤的严重程度而增大的。图8为实际损伤程度以及诊断置信度随时间的变化曲线。

与BIT相似,针对退化效应的故障诊断与预测的性能参数也包括检测、隔离、预测三个方面,其中检测与预测能力是关键。目前采用检测门限、总精度、稳定度、载荷灵敏度来描述故障检测水平,采用预测时机及置信水平、预测距离来描述故障预测水平。

检测门限用于表示达到特定检测置信度时的归一化剩余强度;总精度用于表达在损伤坐标尺下的平均检测置信水平;稳定度用于反映在同一损伤尺度下检测置信度的波动情况;载荷灵敏度来描述不同工作应力水平下检测置信水平的变化;预测时机与相应的置信度一起描述了故障预测水平(prognostics horizon)。预测时机与实际发生故障时间的差距称为预测距离,是另一个描述故障预测水平的关键参数,反映了故障预测是否足够及时,以便预留足够的维修保障准备时间。

 


4.2 故障诊断与预测的性能评价及验证

目前对于PHM技术的不确定性定量评价与验证,采取的主要手段是通过收集历史数据和故障注入产生的数据,建立相应领域的试验台(test bench),来对相应领域的各种故障诊断与预测方法进行验证与评价。

例如,JSF项目资助的注入故障发动机试验台(SFET),用于完成对JSF发动机健康监控方法的验证与评价;宾夕法尼亚大学应用研究实验室(ARL)的机械诊断测试(MDTB),积累了大量齿轮、轴、轴承以及美海军航空母舰重要失效数据; IMPAC公司开发的性能评价工具(MET),用于对基于振动特征的健康监控方法进行评价。

5. 故障预测与健康管理技术展望

PHM技术的发展经历了故障诊断、故障预测、系统集成三个日益完善的阶段,在部件级和系统级两个层次、在机械产品和电子产品两个领域经历了不同的发展历程。当前PHM技术的发展体现在以系统级集成应用为牵引,提高故障诊断与预测精度、扩展健康监控的应用对象范围,支持CBM与AL的发展。

在PHM系统集成应用方面,体现在①如何采用并行工程的原则,与被监控产品设计同步,进行PHM的框架设计与细节设计?②如何进行PHM的定量性能评价与验证?③针对故障预测的不确定性,如何进行风险-收益分析,实现容忍不确定性的保障决策?

在提高故障诊断与预测精度方面,体现在①研究混合及智能数据融合技术,加强经验数据与故障注入数据的积累,提高诊断与预测置信度;②不断寻求高信噪比的健康监控途径。③研究灵巧、健壮的传感器,提高数据源阶段的精度。

在扩展应用对象范围方面,体现在向电子产品故障预测的扩展。①如何与故障预测技术相结合,提升BIT能力,减少CND,降低虚警率?②如何实现LCM不确定性的定量评价?③如何把LCM与损伤标尺技术相结合,提高LCM的置信度?

 
标签: 故障预测 PHM
  
  
  
  
 
更多>同类技术
 
全年征稿 / 资讯合作
 
推荐图文
推荐技术
可能喜欢