文章快速检索  
  高级检索
电子设备故障预测与健康管理技术发展新动态
吕克洪, 程先哲, 李华康, 张勇, 邱静, 刘冠军     
国防科技大学 智能科学学院 装备综合保障技术重点实验室, 长沙 410073
摘要: 电子设备是各类航空、航天等高新技术装备必不可少的重要组成部分。与机械类设备存在明显退化状态征兆不同,电子设备退化状态无明显的外在表现,尚无有效征兆对其状态进行刻画,对其进行故障预测与健康管理存在一定的困难。针对该问题,梳理了电子设备故障预测与健康管理技术的基本概念和内涵,介绍了电子设备故障预测与健康管理技术的国内外研究现状,分析了当前复杂电子设备故障预测与健康管理技术面临的挑战和对策。在此基础上,结合未来复杂电子设备新特点及该领域最新研究进展,从基于间歇故障特征的健康状态表征、面向故障预测与健康管理的测试性设计和多源特征融合的健康状态评估等方面,提出了电子设备故障预测与健康管理技术发展的新方向。
关键词: 电子设备     故障预测     健康管理     测试性设计     间歇故障特征    
New developments of prognostic and health management technology for electronic equipment
LYU Kehong, CHENG Xianzhe, LI Huakang, ZHANG Yong, QIU Jing, LIU Guanjun     
Science and Technology on Integrated Logistics Support Laboratory, School of Intelligence Science, National University of Defense Technology, Changsha 410073, China
Abstract: Electronic devices are indispensable parts of all kinds of high-tech equipment in the aerospace field. Different from the obvious degradation characteristic of mechanic equipment, there is no obvious external manifestation of the degradation state of electronic equipment. There is no effective sign to characterize the state, and there are certain difficulties in fault prediction and health management of the equipment. To overcome this problem, this paper distinguishes the basic concepts and connotations, introduces the latest research trends home and abroad, and analyzes the current challenges and countermeasures in prognostic and health management of electronic equipment. The new characteristics of future complex electronic equipment and the latest research progress in this field are discussed. Three new development directions for prognostic and health management technology for electronic equipment are proposed, including health state assessment based on intermittent fault characteristics, testability design for prognostic and health management, and health state prediction based on multi-source information.
Keywords: electronic equipment     fault prediction     health management     testability design     intermittent fault characteristic    

当今世界,新技术变革方兴未艾,极大地改变着装备形态,也推动了装备保障方式的变革,产生了自主维修保障、增强型状态基维修等新型保障模式。这些保障模式的基础是故障预测与健康管理(Prognostics and Health Management, PHM)技术。PHM代表了装备状态监控、诊断等原有技术适应信息化发展的趋势,代表了装备保障朝着自主化、综合化、一体化、精确化方向发展的趋势,是未来发展的必由之路。各类高新技术装备中,电子设备是必不可少的重要组成部分,如飞机的航电、飞控等系统中包含了大量的电子设备。随着PHM技术的发展,围绕电子设备的故障预测与健康管理问题,近20年来,国内外开展了大量的技术研究工作,取得了一定的进展[1-8]。但从工程实践看,除电池等一些具有明显退化征兆的电子设备外,多数电子设备PHM技术基本停留在方法阶段,工程应用效果不佳。究其原因,与具有较明显退化状态及征兆信息的机械类设备不同,电子设备故障从表现形式上多为突发性,且无明显外在征兆。曾经在一段时间,电子设备的退化是否存在耗损性退化规律、无明显外在征兆信息情况下怎么评估与预测等问题成为该领域的疑惑点,这正是电子设备PHM技术的难点所在,甚至导致一些人认为电子设备不能进行健康评估与预测。

本文针对该问题,梳理了电子设备PHM技术的基本概念和内涵,介绍了电子设备PHM技术的国内外研究现状,分析了当前复杂电子设备PHM技术面临的挑战和对策。在此基础上,结合未来复杂电子设备新特点及该领域最新研究进展,提出了电子设备PHM技术发展的新方向。

1 电子设备PHM技术相关概念及内涵

近年来,国内外学术界对电子设备PHM技术开展了大量研究[1-8],其中涉及到很多的概念和术语。由于目前没有统一标准对这些概念和术语进行界定,导致部分概念和术语混淆使用。为此,本文对电子设备PHM领域容易混淆的部分关键概念/术语及其内涵进行梳理如下。

1.1 损伤与退化

在电子设备PHM领域中,“损伤”和“退化”两个术语比较多见,一般来说它们都可以用来描述电子设备偏离正常情况的某种状态,但是也有区别。“损伤”一般描述电子设备各层级(如器件、功能电路等)物理层面上的某种内在损坏程度(如焊点疲劳损伤、器件静电损伤等)。“退化”则一般与电子设备的功能和性能联系在一起,通常描述电子设备各层级(如器件、功能电路、设备等)完成某种功能的能力衰退程度(如性能退化等)。因此,从某种意义上讲,电子设备损伤可能是电子设备退化的某种原因,例如功率芯片的静电损伤会导致芯片功率输出退化等。

1.2 故障预测与剩余寿命预测

众所周知,“故障预测”与“剩余寿命预测”是PHM的核心和基础,均可以描述设备健康状态的未来变化情况,但从本质上讲,这两个术语有本质区别。按照GJB3385的定义,故障预测是指“根据测试数据确定系统或设备潜在故障的过程”。也就是说故障预测是指根据设备当前测试数据或历史数据等信息,基于某个特定故障的演化规律,预测性地推断设备未来发生该故障的时间。剩余寿命预测是指依据设备的当前测试数据或历史数据等信息,采用合适的寿命预报模型, 确定设备的剩余使用寿命[3]。从区别来讲,故障预测针对的对象是设备特定的某个故障,而剩余使用寿命预测针对的对象是设备本身整体完成规定功能的能力。它们之间属于局部和整体之间的关系。例如,当电子设备某个故障严酷度低,且该故障的发生并不影响电子设备的使用寿命时,该故障的预测结果则不能代表电子设备的剩余寿命预测结果。当电子设备的某个故障与其使用寿命密切相关(如关键故障、单点故障等),或者电子设备仅有一种故障模式时,该故障的预测结果则可以代表电子设备的剩余使用寿命预测结果。一般来说,由于电子设备的故障模式众多,其寿命是其众多故障模式的综合反映,因此,电子设备的剩余寿命预测结果应该是其众多故障预测结果的综合体现,不能混为一谈。

1.3 损伤状态、退化状态、健康状态与使用状态

在电子设备PHM领域中,另一个比较常用的术语是“状态”一词,由于不同学者针对的角度不同,导致对电子设备“状态”的使用也有很大区别,目前该领域应用较多的主要包括:损伤状态、退化状态、健康状态与使用状态等,在1.1节中对“损伤”和“退化”两个术语内涵分析基础上,损伤状态和退化状态的区别也就显而易见。损伤状态是指电子设备内在的物理层面上的某种损坏程度。退化状态是指电子设备外在的完成某种功能的能力衰退程度。通常来说,电子设备的退化状态与健康状态是相对应的,即随着电子设备退化状态的逐渐增加,其健康状态是越来越差的。

无论是损伤状态、退化状态还是健康状态,都描述的是电子设备本身固有的健康衰退情况。由于电子设备的工作环境(使用环境)各不相同且时常变化,健康状态很好的电子设备在恶劣环境中的剩余使用寿命可能很短,而健康状态较差的电子设备在较好的环境中剩余寿命可能很长,因此,损伤状态、退化状态和健康状态还不能独立描述电子设备在使用环境中继续完成规定功能的能力。此时,可将电子设备的健康状态与使用环境相结合分析,采用“使用状态”来描述电子设备在未来工作环境中完成规定功能的能力。具体地,不同类型“状态”间的相互关系如图 1所示。

图 1 各种“状态”间的关系 Fig. 1 Relationship between various "States"
2 电子设备PHM技术研究现状 2.1 电子设备健康耗损性规律

由于电子设备的故障表现多为突发性、随机性,电子设备的退化是否存在系列化状态变化、规律如何等,研究界曾经认识不够清晰,这在一定程度上导致电子设备PHM研究本源性不强。近年来,经深入机理分析与大量试验研究,国际上对电子设备耗损性规律和系列性健康状态是否存在的问题有了初步认识:虽然电子设备故障表现为突发性,但其内部器件/部件等存在随温度、湿度、振动和工作应力而耗损的状态退化过程,即电子设备在服役过程中存在耗损性的系列健康状态,这也为电子设备健康管理提供了理论依据。

在失效物理研究领域,电子设备的电子器件(如功率器件、半导体器件等)退化机理研究已经取得了较大的进展,同时建立了许多具有实际应用价值的失效物理模型。例如比较常见的热载流子退化模型、经时击穿模型、静电损伤模型等[9]。这些失效物理模型相当于描述了这些电子器件在各种应力作用下的退化规律。另外,在电子设备的一些具有特定退化特征的功能单元和机械连接单元的退化机理方面,学术和工程界也开展了一定的研究。例如,电池单元的退化机理与规律研究取得较好的进展,Liu等[10]和Susilo等[11]分别对锂电池的退化机理及状态评估展开了研究。在电路板焊点、连接器、PCB板等机械连接单元的退化机理研究方面也取得了一定进展,Jiang等[12]分析评估了不同温度应力下的焊点损伤,Kwon等[13]对焊点连接件展开了退化规律研究。但总体上说,目前电子设备健康耗损性规律研究主要集中在一些典型电子元器件或功能单元的退化机理和规律方面,对于电子设备整体的退化机理研究较少,耗损性规律尚不明晰。

2.2 电子设备故障预测方法

目前,在PHM技术领域,故障预测方法的研究较多,依据预测采用的数据源以及模型的不同,故障预测的方法分类也较多,基于数据、基于模型等分类方法可以见文献[1-8]。北京航空航天大学曾声奎等[1]很早就提出了故障诊断与预测的认知模型,在该模型的基础上,将故障诊断与预测方法分为:基于故障状态信息、基于异常现象信息、基于使用环境信息、基于损伤标尺、数据融合及综合诊断等5类故障诊断与预测方法[1],该分类比较清楚地给出了故障诊断与故障预测方法发展的完整图像。本文在上述5类方法的基础上,结合电子设备无明显故障征兆的特点,梳理当前电子设备的故障预测方法主要集中在以下4个方面。

1) 基于损伤标尺的故障预测方法

损伤标尺是针对一种或多种故障机理,以被监控电子设备相同的工艺过程制造出来的,预期寿命比被监控对象短的产品。学术界也称之为Canary、预警装置、Precursor等[1, 14]。损伤标尺的基础是对被监控电子设备特定失效机理的清楚认识(如已经建立失效物理模型等),基于特定的失效机理,损伤标尺可以做到定量设计,并可以在电子设备的电子元器件内和电路板级等实现故障预测。目前针对特定的失效机理,已有包含损伤标尺的电子元器件商业化产品,而且可以做到在主器件剩余20%寿命时失效[1]。因此,基于损伤标尺的电子设备故障预测方法的精度较高。近年来,基于损伤标尺的故障预测方法的研究工作仍在持续开展,例如,Chauhan等[15]和Hirohata等[16]分别采用损伤标尺法对菊花链式电路焊点的失效展开了故障预测研究。Battipede等[17]采用基于模型分析的方法构造损伤标尺,对机电伺服系统的故障进行了预测。但总体来说,由于失效机理已经明确且有失效物理模型支撑的元器件相对较少,而且损伤标尺需要在元器件生产过程中进行设计和制造,同时还需要对损伤标尺与监控对象两者的失效机理及应力因素等方面的相似度进行精确掌控,该方法实施难度大,当前应用范围较小。

2) 基于状态信息的故障预测方法

电子设备一般由若干的功能电路/单元等组成,这些电路/单元的输出状态信息部分能够反映电子设备的健康状态。因此,可以直接采用电子设备的功能及性能等状态信息实现电子设备的故障预测[1]。例如,Kirkland等[18]利用采集的电性能退化信息,实现对电子设备典型故障的预测。许丽佳[19]基于纹波电压等状态信息对雷达发射机故障进行预测。Yang等[20]引入神经网络技术建立了电机状态信息与其剩余寿命之间的关联关系,以动态健康指数为基础开展故障预测研究,并在电机上进行了实验验证。Mosallam等[21]针对电池状态信息采用离散贝叶斯滤波器开展了剩余寿命预测研究。Poon等[22]使用广义梯度下降算法来估计开关功率电子系统中的实时参数(例如,电容、电感、寄生电阻),进而将这些参数用于3 kW太阳能光伏交错式升压DC-DC转换器的故障预测。但是,由于电子设备故障普遍具有突发性的特点,大部分的电子设备的功能及性能等状态信息还不能有效反映电子设备的退化,即使部分状态信息(如半导体功率管的阈值电流等)可以较明显反映故障的演化过程,这些参数也往往需要一定的测试条件,直接在线获取这类状态信息比较困难,这也直接导致目前基于状态信息的故障预测方法在电子设备PHM的工程实际中难以大范围实施。

3) 基于环境/工作应力监测与失效模型的故障预测方法

由于电子设备所承受的环境/工作应力信息在工程是比较容易监测得到的,同时基于这些应力作用下的失效物理模型,有可能实现电子设备的故障预测与健康评估。基于该技术原理,美国马里兰大学CALCE中心较早地提出了电子设备“寿命消耗监控(Life Consumption Monitoring,LCM)”方法论[23]。LCM方法通过对环境应力和工作应力的监测,结合电子设备的失效物理模型进行累积损伤计算和典型故障的预测,进而推断产品的剩余寿命。近年来,吕克洪[9]基于时间应力和失效物理模型开展了焊点、功率管等典型电子器件的故障预测。Renwick等[24]通过监测电应力得到了电容器件的状态退化规律并进行故障预测分析。Rana等[25]建立了不同电子元器件的物理失效模型,并基于模型开展了寿命预测研究。整体来说,该方法采集的是电子设备的外围环境/工作应力信息,工程中便于实现,但该方法同时涉及到累积损伤计算和较好的失效物理模型等多个环节,不确定性较大,故障预测精度和准确度相对较低。

4) 基于数据融合的故障预测方法

由于电子系统的复杂性、故障表现的随机性和突变性,近年来,有学者提出了将基于数据融合的方法应用于电子设备故障诊断及预测领域。例如,Liao和Köttig[26]将基于模型的方法和基于数据的方法进行融合开展剩余寿命预测研究,运用丰富的历史数据修正物理模型中权重因子,弥合了数据驱动的预测和基于模型的预测之间的差距。所提出的框架成功应用于锂离子电池剩余使用寿命预测,并且与经典粒子滤波器方法相比实现了明显更好的准确性。Vasan等[27]采用电路输出响应数据估计回归模型参数,考虑元件性能退化的不确定性,引入随机因子以概率分布的形式对模拟电路故障进行了预测,给出了相应的置信度,该方法主要用于可以得到大量输出响应数据的模拟电路。Xu等[28]对电控装置的多维信息进行综合分析,开展了不同工况下的剩余寿命预测研究,取得了一定效果。但是该方法需要大量能有效表征电子设备退化状态的特征参数数据,这方面仍是困扰电子设备PHM技术的难点,因此,该方法目前在预测电子设备故障时准确性仍然较低,而且还具有一定的随机性。

2.3 电子设备状态评估技术

为了对电子设备的健康进行管理决策,电子设备的状态评估是必要环节。由于电子设备状态描述的复杂性,相对故障预测方法而言,关于状态评估的研究相对较少,目前已有的电子设备状态评估技术主要体现在基于数据、基于模型、基于健康指数3个方面。

1) 基于数据的状态评估方法

基于数据的状态评估方法是指在无先验知识的情况下对采集数据进行分析处理,基于数据模型展开状态评估。例如,Cui等[29]在量子力学理论基础上提出了一种新颖的无监督数据驱动方法用于电子设备系统级状态评估,将电子系统健康状态评估视为与数据集中或亲和力水平相关的问题,最终基于数据得到电子设备健康状态退化的痕迹。Hu等[30]针对风电转换器IGBT模块基板焊料疲劳故障,建立了基于壳体温度差的基板焊料疲劳评估方法,以实际风力发电机转换器IGBT模块为例进行了状态评估,为健康状态评估提供了一种新的思路。Vasan和Pecht[31]通过提取电子系统中故障组件的响应参数而非元件自身状态参数,并采用基于核的机器学习算法进行训练,来提高电子系统状态评估的准确性。

2) 基于模型的状态评估方法

基于模型的状态评估方法是通过构造电子设备退化模型来对电子设备状态进行评估,主要包括物理模型和过程模型两种。例如,薛东风和叶继坤[32]融合了核有监督非相关邻域保持投影算法及隐马尔可夫模型对地空导弹电子设备展开状态评估研究。Zhao等[33]针对存在软故障和硬故障竞争风险的系统采用非平稳伽马过程建立系统状态退化模型,通过对退化轨迹及监控时间维度的离散化处理来评估电子系统健康状态,减少了算法计算量。

3) 基于健康指数的状态评估方法

基于健康指数的状态评估方法是在构造电子设备健康指数的基础上,通过对健康指数进行监测进而实现电子设备状态评估。例如,Vasan和Pecht[31]提出了一种以电路为中心的电子系统健康评估方法,将电子设备拆分为若干关键电路,通过对关键电路中节点参数的监控来综合表征系统整体健康状态。和麟等[34]通过对电子设备检测多参数之间的马氏距离进行计算分析,以减少电子设备健康状态评估方法的虚警。Montanari等[35]针对电气设备的绝缘状态评估提出了健康指标的定义,将其健康指标设定为工作时长的函数,并结合退化模型进行评估。沈亲沐[36]和李乾[37]采用累积插入损耗增益等特征对电连接器的使用状态进行评估,取得了较好的效果。

总体来说,虽然当前电子设备的状态评估方法已有一定的进展,但仍然未取得能用于工程实际的实质性突破,其根本原因在于电子设备没有合适的特征参数来对其状态进行表征,且用于状态评估的特征参数难以获取。

2.4 电子设备健康管理

在PHM技术领域中,健康管理的概念范畴可大可小。从广义的概念范畴看,健康管理是一个大的概念,它包括了设备的故障诊断、故障预测、状态评估、维修决策管理等多个方面。但从狭义的范畴看,健康管理主要是指维修决策管理。例如,依据美军的定义,健康管理是指依据装备故障诊断、故障预测等信息,结合可利用的维修资源和维修操作人员等信息,对装备的维修行为做出合适的决策。因此,从狭义概念上讲,电子设备的健康管理是指采用“预先”维修、保养的方法,在获取电子设备故障预测信息和健康状态后,结合相关的维修保障资源信息,在电子设备真正发生故障前采取措施,实现对故障的被动反应到主动的预防。

由于目前整个电子设备PHM技术领域,学术界关注的重点还是在故障预测技术方面,而狭义的电子设备健康管理技术方面的研究还相对较少。具体地,Wang与Pecht[38]将电子系统故障预测中的损伤标尺方法与预防性维修策略相结合,应用更新回报理论与蒙特卡洛仿真的方法,分析了不同维修模型下的单位时间成本,对维修决策具有指导作用。Scanff[39]、Feldman[40]和Vichare[41]等应用随机模型,结合电子设备寿命消耗监控等故障预测方法获取信息,对直升机的航电系统寿命周期成本进行了分析,优化了安全边界和预测距离。徐玉国等[14]基于电子设备损伤标尺的故障预测信息,在完美换件维修的假设下,以单位时间成本、平均使用可用度与平均效费比为指标,提出了一种电子设备预测维修优化决策模型。年夫顺[42]提出健康管理任务主要在于研究监测数据变化和走势,评估设备实际运行状况,建立设备全寿命周期健康档案,为设备维修保障决策提供依据。韩国泰[43]指出航电PHM是一个复杂的信息管理系统,需要运用现代信息技术对飞机的安全和维修进行精确管理。宋磊[44]借鉴云计算技术架构,运用软件开放式设计思想,设计了一种基于云服务的PHM体系结构,对流程进行了设计优化。综上分析,目前电子设备健康管理技术研究主要集中于健康管理系统的总体构架层面,对具体的电子设备健康管理决策方法研究还比较少。

3 电子设备PHM技术面临的挑战及其对策

虽然目前电子设备PHM技术的学术性研究已较多,但除电池等具有特定退化规律的功能单元的PHM技术有一定实质性的进展外,电子设备尤其是复杂电子设备的PHM技术多为跟踪国外研究、借鉴机械类研究或基于数据的黑箱式研究等,基本停留在方法阶段,从应用效果和技术原理上分析,实际上无有效方法。也就是说,当前复杂电子设备的PHM技术面临着巨大的挑战,主要体现在以下几个方面:

1) 电子设备健康耗损性规律不明确

电子设备健康耗损性规律是对其进行故障预测与健康管理的基础。电子设备包含了大量电子元器件和机械连接组件。在不同的环境和工作应力作用下,各电子元器件和机械连接组件的健康退化机理也各不相同,而目前已经建立的退化/失效物理模型仅适用于电子设备中的少数器件和组件,大部分的电子元器件和机械连接组件的退化/失效物理模型还不完善甚至缺乏。因此,作为由各类电子元器件和众多机械连接组件纵横交错而构成的电子设备整体而言,其退化/失效物理模型就更难以定量和准确描述,其健康耗损性规律就更难以获得,这也是目前电子设备PHM技术进展缓慢的重要原因之一。

2) 电子设备健康状态难以表征

机械类设备的退化通常可以通过被测对象的振动等特征信号来对其健康状态进行表征。而电子设备与机械类设备不同,它是由电路板、功能电路、电子元器件等逐层级组合构成,其健康状态是各层级组成单元健康状态的综合体现。目前电子设备仅有少量电子元器件的健康状态可以采用其输出电信号的变化进行表征,大部分电子元器件的退化无明显征兆,这也直接导致电子设备的功能电路级、电路板级甚至设备级的退化状态难以直接观测。当电子设备发生故障时,其电信号往往突然发生变化,且发生间隔时间很短。正因为如此,一些学者把电子设备的故障称为突发性故障,认为难以预测。也就是说,目前还没有合适的可观测的外在征兆来刻画电子设备从正常到故障的衰退过程,即电子设备的健康状态难以表征,这是电子设备PHM技术的一个关键难点。

3) 复杂电子设备PHM特征参数难以获取

当前的电子设备越来越复杂,密集程度越来越高,即使电子设备的部分电子元器件的健康状态可以采用其输出电信号的变化进行表征(即内部具有可用于电子设备PHM的电信号特征参数,如功率器件、半导体器件等),但由于当前的复杂电子设备设计时,基本没有综合考虑电子设备PHM需求,没有预先设计这些特征参数的测试点或测试接口,导致复杂电子设备这些可用于PHM的特征参数在工程中也难以进行捕捉和获取。

4) 电子设备故障发生具有较强随机性

由于电子设备元器件众多,结构复杂,同时各类器件在设计和工艺过程中总存在一定的设计和质量缺陷。在随机的环境应力和工作应力的综合作用下,电子设备器件的各类缺陷被随机激发,所表现出来的故障就具有较强的随机性,这也给电子设备从健康到逐渐耗损的退化过程叠加了随机性,导致电子设备PHM具有很大的不确定性,这也是当前电子设备PHM面临的又一挑战。

针对上述电子设备面临的各项挑战,结合未来复杂电子设备新特点及该领域最新研究进展,本文提出如图 2所示的基本对策,以期对复杂电子设备PHM技术发展新方向提供参考。

图 2 电子设备PHM技术挑战、对策与发展新方向 Fig. 2 Challenges, countermeasures and new development of PHM for electronic equipment

具体地,针对电子设备健康耗损性规律不明确、电子设备健康状态难以表征的难题,需要寻找能够观测且能反映电子设备退化状态的新特征,进而以该特征为基础,研究分析电子设备的健康耗损性规律和健康状态表征技术。近年来研究表明:电子设备的间歇故障特征就可以很好地反映电子设备的退化情况,采用间歇故障特征有可能较好地表征电子设备健康状态。针对复杂电子设备PHM特征参数难以获取的问题,需要在电子设备设计之初就要充分考虑PHM的测试需求。结合电子设备测试性设计相关技术的发展和电子设备的健康管理需求,新近发展的面向PHM的复杂电子设备测试性设计技术可以很好解决电子设备PHM特征参数难获取的技术难题。针对复杂电子设备故障具有一定随机性,导致PHM不确定性大问题,一方面需要提高电子设备的可靠性,减少设计和制造缺陷,另一方面可以以间歇故障特征为主,充分利用状态信息特征、环境应力特征等多源信息,综合分析评估电子设备的健康状态,即基于多源特征的电子设备健康状态评估技术是未来PHM技术发展的又一个新方向。

4 电子设备PHM技术发展新方向 4.1 基于间歇故障特征的电子设备健康状态表征技术

间歇故障是一类持续时间短、可反复出现、未经处理可自行消失的非永久故障。国内外工程实践表明,间歇故障是电子设备服役中后期的一种主要故障类型。近年来,通过国内外的基础研究发现,电子设备的间歇故障往往是其永久故障的前兆,其特征可以有效对电子设备健康状态进行表征和评估,如图 3所示。

图 3 电子设备间歇故障特征随使用时间的变化 Fig. 3 Variation of intermittent fault characteristics of electronic equipment with usage time

尤其近年来,电子设备间歇故障确定性检测技术已经获得了突破,并取得了重大进展[45],基于间歇故障特征的电子设备健康状态表征技术逐渐引起国内外学术界的重视。例如Correcher等[46]均认为电子设备老化是导致间歇故障的主要原因,并且指出间歇故障是电子设备永久故障的前兆。Abreu等[47]研究了间歇故障概率的计算方法。国内方面,周东华等[48-51]针对动态系统的间歇故障诊断问题进行了深入的研究,以间歇故障的成因、幅值特性和不同时刻发生故障之间的相关性等为依据, 对间歇故障进行了分类,提出了一种鲁棒诊断方法,并对多种间歇故障诊断方法的优劣性进行了阐述。Liang等[52]对互连网络的间歇故障诊断技术进行了研究,对互连网络中的间歇故障可诊断性进行了详细分析。国防科技大学沈亲沐[36]、李乾[37]研究了电子设备电连接器的间歇故障振动随机特性、复现、健康状态表征等问题,取得了一定的进展。

从目前研究现状来看,电子设备的间歇故障的检测与诊断问题逐渐被专家学者所关注,利用间歇故障特征来表征电子设备的健康状态从原理上逐渐被认识,已成为电子设备PHM技术发展的新方向。但该技术还处于研究起步阶段,有待进一步研究和突破,主要体现在以下两个方面:

1) 对间歇故障特征与电子设备健康状态的关系认识还很简单。如简单认为间歇故障次数越多、退化状态越严重。通过深入分析,该认识很可能是错误的;或者间歇故障幅值越大、退化状态越严重,但该认识也是不全面的。

2) 缺乏对基于间歇故障特征的健康状态表征模型的深入研究。目前对间歇故障特征的应用仍停留在定性层面,缺乏理论模型对间歇故障与电子设备退化的关联关系进行定量描述,通常是采集间歇故障次数或者幅值,通过简单的对应关系来表征电子设备的当前健康状态。

因此,基于间歇故障特征的电子设备健康状态表征技术研究还基本处于起步阶段,尚需要进行深入的研究。

4.2 面向PHM的复杂电子设备测试性设计技术

由于复杂电子设备结构复杂性,工程领域一般都要求其自身具备故障的自检测和隔离能力,这也是电子设备测试性设计的基本要求(测试必须满足故障检测率、故障隔离率等指标要求)。然而,针对电子设备PHM技术的核心——故障预测的测试需求,当前的电子设备设计时基本还未考虑,也就是说电子设备中没有预先设计各类故障预测特征参数的测试点或测试接口,直接导致复杂电子设备PHM的特征参数难以获取。近年来,结合测试性技术与PHM技术的发展,面向PHM的复杂电子设备测试性设计技术逐渐得到重视[53],该技术在电子设备设计之初,通过系统分析电子设备的PHM测试需求,并通过优化分析,对电子设备全寿命周期内的PHM所需的测试参数、测试资源、测试时机等进行系统规划,并与复杂电子设备的功能开展并行设计,以解决电子设备在全寿命健康管理过程中“测什么、何时测、怎么测”的技术难题,如图 4所示。

图 4 面向PHM的复杂电子设备测试性设计技术 Fig. 4 Testability design technology for PHM of complex electronic equipment

目前,面向PHM的复杂电子设备测试性设计技术已经在国内外开展了一定的研究,并取得了一定进展。例如,NASA从2005年起,持续开展了面向PHM的传感器优化配置技术研究[54]。在QSI公司的TEAMS软件和DSI公司的Express软件中,已将部分测试性理念融入到了装备故障预测与健康评估过程中。国内方面,王宝龙和黄考利[55]建立了面向全寿命周期的电子装备测试性广义模型。张亮和张凤鸣[56]研究了PHM中的传感器优化配置问题。国防科技大学杨述明[57]和谭晓栋[58]开展了面向装备健康状态评估的测试性设计关键技术研究,从面向PHM的测试性指标体系、广义测试性模型、方案优化设计等方面系统的提出了相应的解决方案。随着PHM技术的发展,面向PHM的电子设备测试性设计技术仍将处于探索阶段,还有许多相关技术有待进一步研究突破。主要体现在:面向PHM的电子设备机内测试(Built-In Test, BIT)设计方法(如电子设备间歇故障特征的BIT方法等)、电子设备健康评估推理策略以及面向PHM的测试性设计验证等。

4.3 基于多源特征的电子设备健康状态评估技术

为了减少由于电子设备可靠性、设计制造缺陷、环境/工作应力、预测模型和方法等给故障预测与健康状态评估带来的随机性影响,充分利用电子设备能获取的各种信息和数据是十分必要的。正如前文电子设备故障预测方法、状态评估方法研究现状所述,目前电子设备在多源特征的故障预测与健康评估方法已有一定的研究。但信息的多源可能是“双刃剑”,有效信息的增多将提高PHM能力,关联性相对较弱信息的增加有可能降低有效信息作用而降低PHM能力。

从可以利用的数据源角度分析,电子设备健康状态评估能够采用的多源特征信息如图 5所示,主要包括以下几个方面:①电子设备的可靠性信息(如故障率、平均寿命分布等);②由电子设备BIT、外部测试设备等采集的状态信息;③电子设备的间歇故障特征信息;④电子设备所承受的环境应力/工作应力历程信息;⑤电子设备历史数据信息;⑥电子设备其他相关的信息(如同类型设备的数据信息等)。

图 5 电子设备健康状态评估的多源特征 Fig. 5 Multi-source characteristics for health stateassessment of electronic equipment

上述各种可利用的信息及数据中,间歇故障特征信息能有效表征电子设备健康状态(起到主要表征作用),状态信息也有一定的作用(与设备类型相关),其他信息可以起到一定的辅助作用。因此,在具有上述多源特征情况下,电子设备健康状态评估的核心和难点在于多源特征信息怎么权重与正确融合评估,否则次要信息过多将会影响评估的准确性。但在未来,随着数据挖掘、大数据处理、人工智能、信息融合等先进数据分析方法的发展,先进的融合技术有望充分发挥间歇故障特征健康状态的表征能力,同时有效融合其他辅助性信息,将可能有效提高电子设备的健康状态评估能力。

5 结论

电子设备是各类高新技术装备的重要组成部分,近20年来,国内外纷纷从学术上和工程上开展了大量电子设备PHM技术的研究工作,取得了一定的进展。本文梳理了电子设备PHM涉及的几个易于混淆的关键概念和内涵,对电子设备的健康耗损性规律、故障预测方法、状态评估方法等的国内外研究现状进行深入分析。在此基础上,分析了电子设备PHM技术面临的挑战,并给出了相应的对策,结合未来复杂电子设备新特点及该领域的最新研究进展,从基于间歇故障特征的电子设备健康状态表征、面向PHM的测试性设计等方面,提出了电子设备PHM技术发展的新方向。希望本文能够为电子设备PHM相关领域的研究者提供一些参考和借鉴。

参考文献
[1] 曾声奎, PECHTM G, 吴际. 故障预测与健康管理(PHM)技术的现状与发展[J]. 航空学报, 2005, 26(5): 626-632.
ZENG S K, PECHT M G, WU J. Status and perspectives of prognostics and health management technologies[J]. Acta Aeronautica et Astronautica Sinica, 2005, 26(5): 626-632. (in Chinese)
Cited By in Cnki (292) | Click to display the text
[2] 彭宇, 刘大同, 彭喜元. 故障预测与健康管理技术综述[J]. 电子测量与仪器学报, 2010, 4(1): 1-9.
PENG Y, LIU D T, PENG X Y. A review:Prognostics and health management[J]. Journal of Electronic Measurement and Instrument, 2010, 4(1): 1-9. (in Chinese)
Cited By in Cnki (189) | Click to display the text
[3] 杨占才, 安茂春, 王红. 对发展故障预测和健康管理技术的探讨[J]. 测控技术, 2012, 31(1): 107-110.
YANG Z C, AN M C, WANG H. Exploratory study of developing prognostics and health management technology[J]. Measurement & Control Technology, 2012, 31(1): 107-110. (in Chinese)
Cited By in Cnki (2) | Click to display the text
[4] SUN J Z, LI C Y, LIU C, et al. A data-driven health indicator extraction method for aircraft air conditioning system health monitoring[J]. Chinese Journal of Aeronautics, 2019, 32(2): 199-206.
Click to display the text
[5] HU C H, PEI H, WANG Z Q, et al. A new remaining useful life estimation method for equipment subjected to intervention of imperfect maintenance activities[J]. Chinese Journal of Aeronautics, 2018, 31(3): 514-528.
Click to display the text
[6] 陈华坤, 章卫国, 史静平, 等. 航空电子设备故障预测特征参数提取方法研究[J]. 西北工业大学学报, 2017, 35(3): 364-373.
CHEN H K, ZHANG W G, SHI J P, et al. Research on fature extraction method for fault prediction of avionics[J]. Journal of Northwestern Polytechnical University, 2017, 35(3): 364-373. (in Chinese)
Cited By in Cnki | Click to display the text
[7] 杨军祥, 田泽, 李成文, 等. 新一代航空电子故障预测与健康管理系统综述[J]. 计算机测量与控制, 2014, 22(4): 972-978.
YANG J X, TIAN Z, LI C W, et al. Summary of new generation avionics prognostics and health management System[J]. Computer Measurement & Control, 2014, 22(4): 972-978. (in Chinese)
Cited By in Cnki (5) | Click to display the text
[8] 景博, 黄以峰, 张建业. 航空电子系统故障预测与健康管理技术现状与发展[J]. 空军工程大学学报(自然科学版), 2010, 11(6): 1-6.
JING B, HUANG Y F, ZHANG J Y. Status and perspectives of prognostics and health management technology of avionics system[J]. Journal of Air Force Engineering University(Natural Science Edition), 2010, 11(6): 1-6. (in Chinese)
Cited By in Cnki (37) | Click to display the text
[9] 吕克洪.基于时间应力分析的BIT降虚警与故障预测技术研究[D].长沙: 国防科学技术大学, 2008.
LYU K H. Research on bit false alarm reducing and fault prediction technologies based on time stress analysis[D]. Changsha: National University of Defense Technology, 2008(in Chinese).
[10] LIU D, PANG J, ZHOU J, et al. Prognostics for state of health estimation of lithium-ion batteries based on combination Gaussian process functional regression[J]. Microelectronics Reliability, 2013, 53(6): 832-839.
Click to display the text
[11] SUSILO D D, WIDODO A, PRAHASTO T, et al. State of health estimation of lithium-ion batteries based on combination of gaussian distribution data and least squares support vector machines regression[C]//Materials Science Forum, 2018, 929: 93-102.
Click to display the text
[12] JIANG N, CHEN M, XU S, et al. Lifetime evaluation of solder layer in an IGBT module under different temperature levels[C]//2016 IEEE 8th International Power Electronics and Motion Control Conference (IPEMC-ECCE Asia). Piscataway, NJ: IEEE Press, 2016: 3137-3141.
[13] KWON D, AZARIAN M H, PECHT M. Remaining-life prediction of solder joints using RF impedance analysis and Gaussian process regression[J]. IEEE Transactions on Components, Packaging and Manufacturing Technology, 2015, 5(11): 1602-1609.
Click to display the text
[14] 徐玉国, 邱静, 刘冠军, 等. 基于损伤标尺的电子设备预测维修决策优化[J]. 航空学报, 2012, 33(11): 2093-2105.
XU Y G, QIU J, LIU G J, et al. Optimal predictive maintenance decision of electronics based on canaries[J]. Acta Aeronautica et Astronautica Sinica, 2012, 33(11): 2093-2105. (in Chinese)
Cited By in Cnki (9) | Click to display the text
[15] CHAUHAN P, MATHEW S, OSTERMAN M, et al. In situ interconnect failure prediction using canaries[J]. IEEE Transactions on Device and Materials Reliability, 2014, 14(3): 826-832.
Click to display the text
[16] HIROHATA K, HISAKUNI Y, OMORI T. Prognostic health monitoring method for fatigue failure of solder joints on printed circuit boards based on a canary circuit[J]. Journal of Nondestructive Evaluation, Diagnostics and Prognostics of Engineering Systems, 2018, 1(3): 031004.
Click to display the text
[17] BATTIPEDE M, DALLA V M D, MAGGIORE P, et al. Model based analysis of precursors of electromechanical servomechanism failures[C]//AIAA Modeling and Simulation Technologies Conference. Reston, VA: AIAA, 2015: 2035.
Click to display the text
[18] KIRKLAND L V, POMBO T, NELSON K, et al. Avionics health management: searching for the prognostics grail[C]//IEEE Proceedings of Aerospace Conference. Piscataway, NJ: IEEE Press, 2004: 3448-3454.
Click to display the text
[19] 许丽佳.电子系统的故障预测与健康管理技术研究[D].成都: 电子科技大学, 2009.
XU L J. Research on prognostic and health management technology of electronic system[D]. Chengdu: University of Electronic Science and Technology of China, 2009(in Chinese).
Cited By in Cnki (22) | Click to display the text
[20] YANG F, HABIBULLAH M S, ZHANG T, et al. Health index-based prognostics for remaining useful life predictions in electrical machines[J]. IEEE Transactions on Industrial Electronics, 2016, 63(4): 2633-2644.
Click to display the text
[21] MOSALLAM A, MEDJAHER K, ZERHOUNI N. Data-driven prognostic method based on Bayesian approaches for direct remaining useful life prediction[J]. Journal of Intelligent Manufacturing, 2016, 27(5): 1037-1048.
Click to display the text
[22] POON J, JAIN P, SPANOS C. Fault prognosis for power electronics systems using adaptive parameter identification[J]. IEEE Transactions on Industry Applications, 2017, 53(3): 2862-2870.
Click to display the text
[23] RAMAKRISHNAN A, PECHT M. A life consumption monitoring methodology for electronic systems[J]. IEEE Transactions on Components and Packaging Technologies, 2003, 26(3): 625-634.
Click to display the text
[24] RENWICK J, KULKARNI C S, CELAYA J R. Analysis of electrolytic capacitor degradation under electrical overstress for prognostic studies[C]//Proceedings of the Annual Conference of the Prognostics and Health Management Society, 2015.
[25] RANA Y S, BANERJEE S, SINGH T, et al. Experimental program for physics-of-failure modeling of electrolytic capacitors towards prognostics and health management[J]. Life Cycle Reliability and Safety Engineering, 2017, 6(3): 179-185.
Click to display the text
[26] LIAO L, KÖTTIG F. A hybrid framework combining data-driven and model-based methods for system remaining useful life prediction[J]. Applied Soft Computing, 2016, 44: 191-199.
Click to display the text
[27] VASAN A, BING L, PECHT M. Diagnostics and prognostics method for analog electronic circuits[J]. IEEE Transactions on Industrial Electronics, 2013, 60(11): 5277-5291.
Click to display the text
[28] XU D, SUI S B, ZHANG W, et al. RUL prediction of electronic controller based on multiscale characteristic analysis[J]. Mechanical Systems and Signal Processing, 2018, 113: 253-270.
Click to display the text
[29] CUI Y, SHI J, WANG Z. Quantum assimilation-based state-of-health assessment and remaining useful life estimation for electronic systems[J]. IEEE Transactions on Industrial Electronics, 2015, 63(4): 2379-2390.
Click to display the text
[30] HU Y, SHI P, LI H. Health condition assessment of base-Plate solder for multi-Chip IGBT module in wind power converter[J]. IEEE Access, 2019(7): 72134-72142.
Click to display the text
[31] VASAN A, PECHT M G. Electronic circuit health estimation through kernel learning[J]. IEEE Transactions on Industrial Electronics, 2017, 65(2): 1585-1594.
Click to display the text
[32] 薛东风, 叶继坤. 基于HMM的电子设备健康状态评估方法[J]. 现代防御技术, 2013, 41(2): 187-191.
XUE D F, YE J K. Electronic equipment health assessment methods based on HMM[J]. Modern Defense Technology, 2013, 41(2): 187-191. (in Chinese)
Cited By in Cnki (2) | Click to display the text
[33] ZHAO S, MAKIS V, CHEN S, et al. Health evaluation method for degrading systems subject to dependent competing risks[J]. Journal of Systems Engineering and Electronics, 2018, 29(2): 436-444.
Click to display the text
[34] 和麟, 雷偲凡, 刘洋. 基于距离度量和健康指数的电子设备健康评估方法[J]. 计算机测量与控制, 2017(10): 294-297.
HE L, LEI F S, LIU Y, et al. A health evaluation method of electronic equipments based on multi-parameter distance measurement and health index[J]. Computer Measurement & Control, 2017(10): 294-297. (in Chinese)
Cited By in Cnki | Click to display the text
[35] MONTANARI G C, HEBNER R, MORSHUIS P. An approach to insulation condition monitoring and life assessment in emerging electrical environments[J]. IEEE Transactions on Power Delivery, 2019, 34(4): 1357-1364.
Click to display the text
[36] 沈亲沐.振动环境中电连接器间歇故障机理与诊断技术研究[D].长沙: 国防科技大学, 2016.
SHEN Q M. Research on mechanism and diagnosis of electrical connector intermittent fault under vibration[D]. Changsha: National University of Defense Technology, 2016(in Chinese).
Cited By in Cnki | Click to display the text
[37] 李乾.电连接器间歇故障复现与评估关键技术研究[D].长沙: 国防科技大学, 2018.
LI Q. Research on key technologies of intermittent failures duplication and evaluation for electrical connectors[D]. Changsha: National University of Defense Technology, 2018(in Chinese).
[38] WANG W, PECHT M. Economic analysis of canary-based prognostics and health management[J]. IEEE Transactions on Industrial Electronics, 2011, 58(7): 3077-3089.
Click to display the text
[39] SCANFF E, FELDMAN K L, GHELAM S, et al. Life cycle cost impact of using prognostic health management (PHM) for helicopter avionics[J]. Microelectronics Reliability, 2007, 47(12): 1857-1864.
Click to display the text
[40] FELDMAN K, JAZOULI T, SANDBORN P A. A methodology for determining the return on investment associated with prognostics and health management[J]. IEEE Transactions on Reliability, 2009, 58(2): 305-316.
Click to display the text
[41] VICHARE N M, PECHT M G. Prognostics and health management of electronics[J]. IEEE Transactions on Components and Packaging Technologies, 2006, 29(1): 222-229.
Click to display the text
[42] 年夫顺. 关于故障预测与健康管理技术的几点认识[J]. 仪器仪表学报, 2018, 39(8): 1-14.
NIAN F S. Viewpoints about the prognostic and health management[J]. Chinese Journal of Scientific Instrument, 2018, 39(8): 1-14. (in Chinese)
Cited By in Cnki | Click to display the text
[43] 韩国泰. 航空电子的故障预测与健康管理技术[J]. 航空电子技术, 2009, 40(1): 30-38.
HAN G T. Prognostics and health management of avionics[J]. Avionics Technology, 2009, 40(1): 30-38. (in Chinese)
Cited By in Cnki (43) | Click to display the text
[44] 宋磊.军用电子设备预测与健康管理体系结构及关键技术研究[D].成都: 电子科技大学, 2018.
SONG L. Research on PHM Architecture and key technology of military electronic equipment[D]. Chengdu: University of Electronic Science and Technology of China, 2018(in Chinese).
Cited By in Cnki | Click to display the text
[45] ANDERSON K. Focused technology transition: intermittent fault detection & isolation systemTM (IFDISTM)[C]//DoD Maintenance Symposium, 2014.
[46] CORRECHER A, GARCIA E, MORANT F, et al. Intermittent failure dynamics characterization[J]. IEEE Transactions on Reliability, 2012, 61(3): 649-658.
Click to display the text
[47] ABREU R, ZOETEWEIJ P, GEMUND A J C V. A new bayesian approach to multiple intermittent fault diagnosis[C]//International Jont Conference on Artifical Intelligence, 2009.
Click to display the text
[48] 周东华, 史建涛, 何潇. 动态系统间歇故障诊断技术综述[J]. 自动化学报, 2014, 40(2): 161-171.
ZHOU D H, SHI J T, HE X. Review of intermittent fault diagnosis techniques for dynamic systems[J]. Acta Automatica Sinica, 2014, 40(2): 161-171. (in Chinese)
Cited By in Cnki (34) | Click to display the text
[49] ZHOU D H, ZHAO Y H, WANG Z D. Review on diagnosis techniques for intermittent faults in dynamic systems[J]. IEEE Transactions on Industrial Electronics, 2019(99): 1-1.
Click to display the text
[50] YAN R, HE X, WANG Z, et al. Detection, isolation and diagnosability of intermittent fault in stochastic systems[J]. International Journal of Control, 2018, 91(2): 480-494.
Click to display the text
[51] 鄢镕易, 何潇, 周东华. 一类存在参数摄动的线性随机系统的鲁棒间歇故障诊断方法[J]. 自动化学报, 2016, 42(7): 1004-1013.
YAN R Y, HE X, ZHOU D H. Robust diagnosis of intermittent faults for linear stochastic systems subject to time-varying perturbations[J]. Acta Automatica Sinica, 2016, 42(7): 1004-1013. (in Chinese)
Cited By in Cnki (1) | Click to display the text
[52] LIANG J R, FENG H, DU X. Intermittent fault diagnosability of interconnection networks[J]. Journal of Computer Science &Technology, 2017, 32(6): 1279-1287.
Click to display the text
[53] 刘艳芳, 吕江花, 马世龙, 等. 航电系统并行检测过程与检测设备解耦方法[J]. 航空学报, 2019, 40(8): 322818.
LIU Y F, LYU J H, MA S L, et al. Decoupling method for test process and test devices in parallel testing of avionics systems[J]. Acta Aeronautica et Astronautica Sinica, 2019, 40(8): 322818. (in Chinese)
Cited By in Cnki | Click to display the text
[54] SIMON D L, GARG S. A systematic approach to sensor selection for aircraft engine health estimation: NASA/TM-215839[R].Washington, D.C.: NASA, 2009.
[55] 王宝龙, 黄考利. 面向生命周期的复杂电子装备测试性建模[J]. 仪器仪表学报, 2006, 27(6): 1230-1232.
WANG B L, HUANG K L. Testability modeling of complicated electronic equipments facing to life cycle[J]. Chinese Journal of Scientific Instrument, 2006, 27(6): 1230-1232. (in Chinese)
Cited By in Cnki (2) | Click to display the text
[56] 张亮, 张凤鸣. 装备健康管理中的传感器优化配置问题研究[J]. 传感器与微系统, 2008, 27(7): 18-20.
ZHANG L, ZHANG F M. Research on optimal sensor placement in equipment health management[J]. Transducer and Microsystem Technologies, 2008, 27(7): 18-20. (in Chinese)
Cited By in Cnki (11) | Click to display the text
[57] 杨述明.面向装备健康管理的可测性技术研究[D].长沙: 国防科技大学, 2012.
YANG S M. Research on testability technology for equipment health management[D]. Changsha: National University of Defense Technology, 2012(in Chinese).
Cited By in Cnki (4) | Click to display the text
[58] 谭晓栋.面向装备健康状态评估的可测性设计关键技术研究[D].长沙: 国防科技大学, 2013.
TAN X D. Research on key technologies of design for testability for health state evaluation[D]. Changsha: National University of Defense Technology, 2013(in Chinese).
Cited By in Cnki | Click to display the text
http://dx.doi.org/10.7527/S1000-6893.2019.23285
中国航空学会和北京航空航天大学主办。
0

文章信息

吕克洪, 程先哲, 李华康, 张勇, 邱静, 刘冠军
LYU Kehong, CHENG Xianzhe, LI Huakang, ZHANG Yong, QIU Jing, LIU Guanjun
电子设备故障预测与健康管理技术发展新动态
New developments of prognostic and health management technology for electronic equipment
航空学报, 2019, 40(11): 023285.
Acta Aeronautica et Astronautica Sinica, 2019, 40(11): 023285.
http://dx.doi.org/10.7527/S1000-6893.2019.23285

文章历史

收稿日期: 2019-07-13
退修日期: 2019-08-12
录用日期: 2019-08-30
网络出版时间: 2019-09-03 15:18

相关文章

工作空间