Fault diagnosis method of helicopter tail transmission systems based on graph domain generalization

Guowang CHEN; Qian TANG; Liu HE

doi:10.7527/S1000-6893.2025.32642

ACTA AERONAUTICAET ASTRONAUTICA SINICA >

2026 , Vol. 47 >Issue 7: 232642 - 232642

DOI: https://doi.org/10.7527/S1000-6893.2025.32642

Solid Mechanics and Vehicle Conceptual Design

Fault diagnosis method of helicopter tail transmission systems based on graph domain generalization

Guowang CHEN ¹^,² ,
Qian TANG ^,¹ ,
Liu HE ¹

Expand

^1. College of Mechanical and Vehicle Engineering，Chongqing University，Chongqing 400044，China
^2. School of Robotics Engineering，Yangtze Normal University，Chongqing 408100，China

E-mail： tqcqu@cqu.edu.cn

Received date: 2025-07-31

Revised date: 2025-10-09

Accepted date: 2025-12-25

Online published: 2025-12-29

Supported by

National Natural Science Foundation of China(52335006)

Chongqing Natural Science Foundation(CSTB2023NSCQ-LZX0137)

Fold

Abstract

To address the challenges of limited access to high-quality fault data and the poor generalization performance of traditional transfer learning methods on unseen fault types， this paper proposes an Adaptive-weight Multi-level Fusion Graph Domain Generalization （AMFGDG） framework for fault diagnosis of helicopter tail transmission systems. Specifically， multi-node vibration signals under various health conditions are generated by integrating the concentrated mass method with the finite element method， and their validity is experimentally verified. Graph-structured samples with finite element nodes are constructed from the generated data for multiple source domains， while test data from different sensors are formulated as target domain graphs. A self-attention mechanism is employed to adaptively update edge weights， enabling precise modeling of inter-node influence. Additionally， a mixture-of-experts gating strategy is introduced to fuse information across graph layers and mitigate the over-smoothing effect in deep GNNs. The model is optimized via a joint loss function combining classification loss， deep clustering loss， and local distribution alignment loss. Diagnostic results and ablation studies on a private helicopter tail transmission test bench dataset and the public Case Western Reserve University （CWRU） bearing dataset demonstrate the proposed method’s low data dependency and strong generalization capability， achieving an accuracy of up to 95.4%.

Key words： fault diagnosis; helicopter tail transmission system; graph convolutional networks; domain generalization; dynamic modeling

Cite this article

Guowang CHEN , Qian TANG , Liu HE . Fault diagnosis method of helicopter tail transmission systems based on graph domain generalization[J]. ACTA AERONAUTICAET ASTRONAUTICA SINICA, 2026 , 47(7) : 232642 -232642 . DOI: 10.7527/S1000-6893.2025.32642

直升机尾传动系统是尾旋翼获得动力的唯一传递路径，它是直升机系统不可或缺的部分^［1］。由于其结构形式复杂、传动链长，导致在极端工况下更容易发生机械故障。尾传动系统的故障会降低直升机运行寿命和威胁人员安全，因此对直升机尾传动系统进行健康监控是必要的。但是，由于直升机的工况复杂、数据保密，导致获取高质量丰富特征的故障数据需要付出巨大的代价。另外，当直升机发现新的故障时，传统迁移学习模型泛化能力减弱。因此有必要研究在极端数据条件下（源域没有测试数据，目标域有测试数据），如何提升直升机尾传动系统故障诊断模型的泛化能力。

直升机传动系统的故障诊断方法主要分为：统计分析、信号处理、机器学习及深度学习。在直升机传动系统早期故障研究中，数学统计方法依托概率分布与参数估计，在噪声干扰较强的场景下有效识别异常状态，成为最先被应用的诊断策略之一。Elasha等^［2］通过自适应滤波、谱峭度及包络分析等信号分离技术，对大型CS-29直升机主减速器行星轴承的振动与声发射数据进行联合监测，实现了在强齿轮噪声背景下的早期缺陷识别。Zhou等^［3］通过多种频域处理技术，对CH-46E直升机主减速器振动数据进行分析，成功识别了行星轴承内外圈缺陷。尽管统计方法具备良好的抗噪能力，但在面对复杂非线性系统和动态环境时，对高维特征的提取与适应性仍受限，难以满足现代直升机系统的智能诊断需求。

随着数字信号处理技术的不断演进，各种时域、频域信号分析策略被广泛应用于直升机振动信号的故障模式提取中，为信号特征精细化表达提供了技术支撑。Sawalhi等^［4］建立了一种用于隔离和增强轮缘裂纹特征，并追踪行星齿轮的裂纹增长直升机传动故障处理方法。张新等^［5］设计了一种基于最大平均峭度的盲解卷积方法，直升机故障诊断案例表明其能有效恢复故障冲击序列，增强故障特征提取能力。信号处理方法在特征提取方面具备良好的通用性与适配性，但其严重依赖于人工规则与经验参数设计，缺乏数据驱动下的自动建模能力，限制了诊断泛化性能。

为弥补传统方法对特征构造的高度依赖，机器学习方法引入数据驱动思想，能够从大规模数据中自动学习判别模式，提升了对复杂工况与非线性特征的适应能力。Kong等^［6］通过基于数据驱动字典设计的稀疏分类方法，实现了在强调制和齿轮干扰背景下对行星传动系统行星轴承故障的高精度智能识别。谢习华等^［7］提出了一种基于粒子群优化和广义回归神经网络的直升机旋翼不平衡故障诊断方法。尽管机器学习模型展现出一定的泛化能力和智能化水平，但仍需依赖特征工程环节。

近年来，深度学习凭借其端到端建模能力和强非线性学习能力，已成为直升机传动系统智能故障诊断的重要研究方向，尤其在处理高噪声、复杂非线性信号方面表现出显著优势。Li等^［8］提出了一种基于自适应通道加权卷积神经网络的多传感器融合方法，实现直升机传动系统的状态监测。Sun等^［9］建立了一种基于多传感器图自适应联邦泛化的方法，用于解决直升机传动系统复杂结构带来的故障诊断挑战，同时保护数据隐私。余志锋等^［10］提出了一种基于K-最近邻（K-Nearest Neighbors， KNN）算法的卷积神经网络模型，有效提升了直升机滚动轴承的故障诊断能力。李恒等^［11］建立了一种基于数字孪生与迁移学习的故障诊断方法，采用基于高斯核函数的领域自适应方法，以缩小仿真数据与实验数据在特征空间的分布差异。尽管深度模型具备自动特征提取与强鲁棒性优势，然而，现有基于深度学习的直升机传动系统故障诊断方法普遍面临2个关键挑战：一是故障数据获取困难，真实工况下高质量、多场景的故障样本极度稀缺；二是仿真域与测试域之间存在显著分布差异，严重限制了模型在实际工况中的泛化能力。因此，如何在小样本下缩小仿真和测试数据的分布差异，已成为基于深度学习的故障诊断亟待突破的关键问题。

为了解决上述问题，本文提出了一种新的自适应权重多级融合图域泛化（Adaptive-weight Multi-level Fusion Graph Domain Generalization， AMFGDG）故障诊断方法。该模型使用自适应权重多级融合挖掘不同粒度的特征，最后实现仿真域的图特征迁移到测试域。提出的AMFGDG故障诊断方法的创新点总结如下：

1）提出了一种AMFGDG域泛化方法，实现仿真域到测试域的知识迁移，并使用2个数据集验证其有效性。

2）设计了一种混合专家门控图特征融合策略，能同时捕捉不同粒度下的图特征，提升模型特征提取能力。

3）结合有限元法与集中质量法，建立了一种高保真系统级的故障数据生成方法，并通过实验验证了其有效性。

1 相关工作

1.1 多源域泛化

在现实世界中源域和目标域的数据分布存在领域偏移是不可避免的。多源域泛化旨在从多个源域学习故障诊断的域不变知识，并将其迁移到从未见过的目标域，多源域泛化任务如图1所示。

显示原图|下载原图ZIP|生成PPT

图 1 多源域泛化描述

Fig.1 Multi-source domain generalization description

当前已有许多学者对故障诊断领域的域泛化问题进行深入研究。Li等^［12］针对无监督对抗学习通常无法生成多模式故障样本，并存在模式坍塌等缺点，提出了一种有监督改进辅助分类器对抗网络。Guo等^［13］引入了一种基于CycleGAN的域生成模块，以产生与源域有显著差异的扩展域，从而增强模型的泛化能力。Li等^［14］针对在实时跨域故障诊断中，无法提前获得测试数据，提出通过水平缩放时间振动数据，人为地创建额外虚假域的域增强方法来扩展可用数据集。Fan等^［15］采用基于mixup的数据增强来变换故障数据，从而补偿不同类别和域空间中缺失的信息，并增加类别和域空间的多样性。Zhao等^［16］针对在实时跨域故障诊断中，目标数据无法提前获取，通过全局分布对齐和局部类别聚类来学习域不变知识并获得判别性表示。Shi等^［17］阐述了一种结合动态加权策略和批量谱惩罚正则化项的对抗训练方案，以便从具有潜在差异的多个源域中提取域不变和判别性特征。Jia等^［18］提出了一种名为因果解耦域泛化方法，通过结构因果模型将时间序列数据解耦为因果因素和非因果因素来重建数据生成过程。

1.2 图神经网络

由于图神经网络能表示非欧几里得空间的数据关系，近期有许多故障领域的学者使用图神经网络提取有相互依赖关系的数据特征。Li等^［19］建立了一个基于图神经网络的新型智能故障诊断框架，并提供了开源代码。Chen等^［20］提出了一种半监督自纠正图神经网络，能够有效地从振动信号中提取特征，并生成故障知识的图结构表示。Yin等^［21］提出了一种多尺度图卷积网络，解决了忽略不同尺度信号之间潜在的关系问题。Wang等^［22］在缺乏足够标记数据的情况下，提出了一种名为双图神经网络的新型少样本学习方法，并使用残差块来解决有限数据下的故障诊断问题。Wang等^［23］提出了一种考虑多传感器信号的结构信息具有注意力感知模块的新型时序-空间图神经网络，以实现多源信息融合。Liu等^［24］提出了一种因果干预图神经网络框架，使用注意力机制将传感器信号构建成结构属性图，并设计了一个工具变量来实施因果干预以减轻混杂效应。Liu等^［25］提出了一种基于简化图卷积神经网络的半监督元学习少样本轴承故障诊断方法。考虑每个频谱样本作为一个节点，根据节点之间的邻接关系构建KNN图，从而将轴承故障分类转化为图节点分类。Li等^［26］为了充分利用多域特征的优势，提出了一种结合时域和频域特征的多视图图神经网络，用于多传感器旋转机械系统的故障诊断。李晖等^［27］提出基于遗传进化构图的联邦图卷积网络方法，通过联合学习与自适应图结构优化，有效提升了跨客户端故障诊断的准确性与泛化能力。

1.3 基于动力学的数据生成

由于基于物理模型的数据生成方法有较强的解释性和评估模型质量相对容易，当前用于故障数据生成的方法主要是集中在物理模型驱动的方法，主要分为集中质量法、有限元法及相关混合方法。Qin等^［28］设计零件级滚动轴承动力学模型，并基于嵌入物理知识的故障诊断网络实现模型参数反演，进而建立数字孪生驱动的故障数据生成方法，生成多工况高质量故障样本以解决样本不平衡问题。Yu等^［29］构建零件级滚动轴承动力学模型生成仿真样本，并结合双向长短期记忆网络与多头注意力机制设计CycleGAN变体进行时序故障数据映射，实现在无实测故障数据条件下的高质量类型可控生成。Ming等^［30］提出滚动轴承零件级数字孪生辅助数据融合策略生成增强样本，并结合频域过滤子域自适应网络实现数字孪生数据与实测数据的特征对齐，构建适用于类别不平衡场景的深度诊断框架。张锐奇等^［31］构建了具有明确时频域故障特征的四自由度轴承动力学模型，生成可表征实际故障的仿真数据，并基于对抗式域自适应网络实现仿真源域与实测目标域的特征对齐。于树博等^［32］提出零件级动力学仿真驱动的特征分离型域自适应诊断方法，实现了小样本滚动轴承故障识别。Xu等^［33］设计紧固杆转子系统的部件级集中参数模型并结合故障数学模型进行仿真数据生成，建立面向样本稀缺问题的智能诊断框架。张龙等^［34］利用有限元法生成多工况多故障类型仿真数据，构建故障投影矩阵以同步去除实测信号中的工况冗余特征，最终结合支持向量机实现高精度故障识别。Wang等^［35］设计系统级旋转矢量减速器数值模型并通过鲸鱼优化算法进行参数识别，引入噪声生成网络修正仿真数据，最终基于多任务残差网络实现仿真驱动下的故障类型与严重程度联合识别，有效解决了样本缺失与分布差异难题。肖刚等^［36］构建了包含导轨故障激励的电梯轿厢水平系统动力学模型，生成多工况下的水平振动仿真数据，并结合子领域自适应残差卷积网络，实现了在无监督条件下的导轨故障诊断迁移。

基于动力学建模的数据生成策略，具有可解释性好、可控性好的特点，因此选择采用面向直升机尾传动系统的系统级动力学建模策略，以构建高保真的故障数据生成模型。

1.4 域泛化任务定义

给定K个源域

𝒟 S = 𝒟 1 S, 𝒟 2 S, …, 𝒟 k S, …, 𝒟 K S

，

𝒟 k S = x k, i S, y k, i S, d k, i S

k = 1,2, …, K; i = 1,

2, …, n k S

中，

x k, i S ∈ 𝒳 S

表示第k个源域的第i个数据样本；

y k, i S ∈ 𝒴 S

表示第k个源域的第i个样本标签；

d k, i S

表示第k个源域的第i个数据样本的域标签；

n k S

表示第k个源域样本数量。

类似的，

𝒟 T = 𝒟 1 T, 𝒟 2 T, …, 𝒟 k T, …, 𝒟 K T

，

𝒟 k T = x k, i T, y k, i T, d k, i T

k = 1,2, …, K; i = 1,2, …, n k T

中，

x k, i T ∈ 𝒳 T

表示第k个目标域的第i个数据样本；

y k, i T ∈ 𝒴 T

表示第k个目标域的第i个样本标签，在训练中不可见；

d k, i T

表示目标域标签；

n k T

表示第k个目标域样本数量。文中源域和目标域数量K分别设置为3和1。源域和目标域的数据特征空间和标签空间相同

𝒳 S = 𝒳 T

，

𝒴 S = 𝒴 T

，但是它们的联合概率分布不同

P k S x, y ≠ P T x, y

k = 1,2, …, K

。本文的域泛化类型属于同质、跨工况和源域标签均可见的域泛化，其目标是学习一个映射函数

f : y = f x

，该函数学习不同源域的不变域特征，并能在未知目标域实现最优的泛化表示。

2 提出的AMFGDG方法

2.1 提出方法框架

用于直升机尾传动系统故障诊断的图域泛化方法AMFGDG框架如图2所示，提出的AMFGDG故障诊断框架包含使用仿真域图网络的训练阶段和使用测试域图网络的测试阶段。训练阶段，基于有限元节点和对应传感器构建空间图，使用图卷积网络进行图特征更新，使用分类器损失函数L _cls对源域故障类型分布进行预测，使用L _LMMD损失函数衡量不同源域的全局故障分布差异，运用L _clust损失函数对所有源域故障类型进行聚类，最后完成模型参数更新。基于源域训练好的模型参数，最终在目标域完成测试迁移任务，得到最终目标域的故障类型分布结果。

显示原图|下载原图ZIP|生成PPT

图 2 提出的AMFGDG 框架

Fig.2 Proposed AMFGDG framework

2.2 图构建策略

为了实现基于图网络的直升机尾传动系统故障诊断域泛化，需设计源域和目标域的图结构数据样本，如图3所示。以有限元模型中节点或测试平台的传感器作为图中的节点

N = n 1, n 2, …, n N

，以各节点的振动数据作为节点特征

X = x 1, x 2, …, x N

，运用KNN构建边，从而获得图特征驱动的图

G = A, N, X

。直升机尾传动系统数据集中图节点的特征是12个传感器或者对应有限元节点的振动数据；为了充分验证提出域泛化方法的跨工况泛化能力，还以西储大学轴承数据集的3个传感器或者对应有限元节点的振动数据作为图节点的特征。

显示原图|下载原图ZIP|生成PPT

图 3 不同域的图构建

Fig.3 Graph construction in different domains

为刻画节点之间在振动特征的相似性，采用原始振动数据

x

_i 与

x

_j 间的余弦相似度进行边构建，定义节点n_i 与n_j 的相似度为

s i m (i, j) = x i T x j x i 2 ⋅ x j 2

（1）

式中：

· 2

表示二范数；

s i m i, j

为余弦相似度算子。

对每个节点n_i，选取余弦相似度最接近的前K个节点作为邻居，构建边连接关系可表示为

A i j = 1 j ∈ T o p - K i 0 其他

（2）

式中：

A i j = 0

表示节点n_i 与n_j 无连接关系；

A i j = 1

则表示有连接关系。

基于上述边构造，构成图网络的邻接矩阵

A

，并最终形成图

G = A, N, X

。

2.3 图特征表征网络

不同节点之间的动态影响强弱差异显著，因此引入自注意力机制建立能反应节点间影响强弱的自适应边权重。为了同时获取不同卷积层多尺度的语义信息，运用混合专家门控机制融合不同层的卷积网络特征，实现浅层与深层语义协同学习，避免硬融合产生的噪声冗余，图特征表征网络结构如图4所示。

显示原图|下载原图ZIP|生成PPT

图 4 自适应权重多级图卷积网络

Fig.4 Adaptive weight multi-level graph convolutional network

为提升图建模中节点间信息传递的选择性，基于KNN图，进一步引入自注意力机制对已有邻接矩阵A赋予动态权重。

给定节点n_i 、n_j 的特征x_i 、x_j，使用线性变换将其分别映射为查询向量q_i 、键向量k_j ：

q i = W q x i k j = W k x j

（3）

式中：

W q 、 W k

为可学习的权重参数。

对于存在初始连接的节点对（n_i， n_j ），计算其注意力得分，可表示为

α i j = e x p q i T k j d ∑ k ∈ 𝒩 i e x p q i T k k d

（4）

式中：

α i j ∈ (0,1)

表示节点n_j 对节点n_i 的信息贡献度；

𝒩 i = j A i j = 1

为节点i的邻接集合；d为缩放因子。

利用注意力机制计算出动态边权重后，构造新的带权重邻接矩阵

A ˜

，可重写为

A ˜ i j = α i j A i j = 1 0 其他

（5）

从而形成最终的边加权图结构

G = (A ˜, N, X)

。

给定加权邻接矩阵

A ˜

与节点特征X，图卷积操作可表示为

H (l) = R e L U D ˜ - 1 / 2 A ˜ D ˜ - 1 / 2 H (l - 1) W (l)

（6）

式中：H ^（0）=X为初始图卷积层特征；H ^（ ^l ^）表示第l层的中间层特征；W ^（ ^l ^）为第l层的可学习权重；

D ˜

为

A ˜

的度矩阵；ReLU（·）是非线性激活函数。

接着通过混合专家门控融合机制对每一层输出引入门控权重

g i (l)

实现个性化加权。先将3层节点表示拼接为输入向量

z i

表示为

z i = h i (1) ‖ h i (2) ‖ h i (3)

（7）

式中：

h i (l)

表示节点i在图网络层l的特征向量；符号“||”表示拼接操作。

再通过线性变换与Softmax函数获得3层图卷积网络特征融合的门控系数

g i (l) = e x p w g (l) T z i ∑ l = 1 3 e x p w g (l) T z i l = 1,2, 3

（8）

式中：

g i (l)

表示节点i的第l分支门控系数；

w g (l)

为第l分支的门控权重向量。

因此，单个节点融合后特征

h i o u t

可表示为

h i o u t = ∑ l = 1 3 g i (l) ⋅ h i (l)

（9）

最后得出所有节点的输出

H o u t

表示矩阵：

H o u t = h 1 o u t, h 2 o u t, …, h N o u t T

（10）

该输出特征将作为后面下游任务直升机故障诊断分类的特征输入。

2.4 损失函数与参数更新

为有效提升模型在尾传动系统多工况下的故障识别能力，联合采用三类损失函数来优化模型学习目标：监督分类损失L _cls、分布对齐损失L _LMMD以及深度聚类损失L _clust。三者协同作用，既可增强模型的判别性，又能提升其跨域泛化能力与聚类表达结构的一致性。

1）监督分类损失L _cls

对于有标签样本，采用交叉熵损失衡量模型预测与真实标签之间的差异。模型输出为

Y^= S o f t m a x H o u t W c l s

（11）

式中：

W c l s

为线性分类器参数；

Y^

表示类别概率矩阵。

接着，交叉熵损失函数定义为

L c l s = - 1 n ∑ i = 1 n y i T l n (y^i)

（12）

式中：

y i ∈ {0,1} c

表示第i个样本的one-hot真实标签；

y^i

为对应样本i的预测概率向量；c为故障类别数。

2）分布对齐损失L _LMMD

为缓解源域与目标域之间的分布差异，引入局部最大均值差异（Local Maximum Mean Discrepancy， LMMD）作为分布对齐损失^［37］。设

H s c

、

H t c

分别表示源域与目标域中第c类节点的融合特征集合，则L _LMMD损失定义为

L L M M D = ∑ c = 1 C 1 n c s ∑ h i ∈ H s c h i - 1 n c t ∑ h j ∈ H t c h j 2

（13）

式中：

n c s

、

n c t

分别为第c类在源域、目标域中的样本数量。

3）深度聚类损失L _clust

为了增强无标签节点在潜在语义空间中的聚类结构，基于深度聚类框架，引入基于KL散度的聚类损失^［38］。定义样本h_i 到聚类中心μ_j 的学生分布为

q i j = 1 + h i - μ j 2 β - β + 1 2 ∑ k = 1 K 1 + h i - μ k 2 β - β + 1 2

（14）

式中：q_ij 为第i个样本属于第j个聚类中心的概率；h_i 表示第i个节点的融合特征；μ表示第j个聚类中心的可学习向量；β为学生的t分布自由度参数；K为聚类中心总数。

根据学生分布，进而定义目标分布：

p i j = q i j 2 / ∑ i = 1 N q i j ∑ k = 1 K q i k 2 / ∑ i = 1 N q i k

（15）

式中：p_ij 为构造的目标分布。

因此，聚类损失函数L _clust可以表示为

L c l u s t = ∑ i = 1 N ∑ j = 1 K p i j l n p i j q i j

（16）

最后模型的总损失函数可以表示为

L t o t a l = L c l s + λ 1 ⋅ L L M M D + λ 2 ⋅ L c l u s t

（17）

式中：L _total是总损失函数；λ ₁、λ ₂为损失权重超参数。

因此模型参数更新可以表示为

θ G C N ← θ G C N - η ⋅ ∇ θ G C N L t o t a l θ M o E ← θ M o E - η ⋅ ∇ θ M o E L t o t a l θ c l s ← θ c l s - η ⋅ ∇ θ c l s L c l s θ μ ← θ - μ η ⋅ ∇ μ L c l u s t θ a t t ← θ a t t - η ⋅ ∇ θ a t t L t o t a l

（18）

式中：θ _GCN表示图卷积网络权重参数；θ _MoE为混合专家模型的权重参数；θ _cls是分类器权重参数；θ_μ 表示可学习聚类中心的权重参数；θ _att是自注意力机制权重参数；η是学习率；

∇

表示损失函数对参数θ的梯度算子。

2.5 故障诊断流程

根据图2中直升机尾传动系统故障诊断方法整体框架，给出直升机尾传动系统的详细诊断流程：

步骤1 基于图5生成的仿真数据作为源域样本与对应传感器数据为目标域样本，构建不同域的空间拓扑图。

显示原图|下载原图ZIP|生成PPT

图 5 仿真数据生成流程图

Fig.5 Flowchart of simulation data generation

步骤2 运用混合专家门控机制和自注意力机制，构建自适应多层混合图网络，并基于图卷积网络进行图聚类更新。

步骤3 基于监督分类损失函数L _cls、分布对齐损失函数L _LMMD以及深度聚类损失函数L _clust3个损失函数完成网络权重系数更新。

步骤4 可视化故障诊断分类结果，并分析不同诊断方法的性能。

3 故障诊断实验

3.1 故障数据生成与验证

为了实现基于动力学生成的仿真域（源域）到测试域（目标域）的知识泛化，运用动力学建模方法生成了不同故障类型的振动数据，并基于直升机尾传动试验台验证了该数据生成方法的有效性。

3.1.1 高精度故障数据生成策略

为了运用动力学生成故障数据，完成仿真域到测试域的泛化任务，需建立高保真的直升机尾传动系统动力学模型，图6显示了直升机尾传动系统的三维结构。坐标系X ₁ Y ₁ Z ₁为水平轴的局部坐标系，坐标系X ₂ Y ₂ Z ₂为斜轴的局部坐标系，X ₃ Y ₃ Z ₃为尾桨轴的局部坐标系。这里需要指出的是后面动力学建模是在各自局部坐标系下建立的，这是为了和传感器的方位保持一致，可降低建模难度。红色箭头表示该尾传动系统的功率流向。

显示原图|下载原图ZIP|生成PPT

图 6 直升机尾传动系统三维模型

Fig.6 Three-dimensional model of helicopter tail transmission system

现实环境中直升机传动系统长久运行，会导致系统不对中情况，不对中会改变零部件的等效力学模型。因此有必要表征反映随不对中变化的等效刚度。此外，植入不同零部件的故障特征，建立含不对中和故障综合影响的直升机尾传动系统动力学模型，并运用Newmark-β方法求解各个节点的振动响应。但是，该数据生成方法存在输入扰动与背景噪声难以描述、动力学建模的边界条件难以准确获取、各个零部件动力学模型的非线性和时变性难以表征的弱点。

3.1.2 故障数据精度验证

为验证上节中故障数据生成策略的有效性，搭建了直升机尾传动实验台，如图7所示。该试验台由试验台样机、私人电脑、采集卡、不同传感器、控制柜组成，其中试验台传动系统由电机、水平轴段、斜轴段、输出轴段及制动器组成。数据采集的采样频率为25 600 Hz，采样时间为30 s。试验台上布置了3个三轴加速度传感器、2个涡流位移传感器和7个单轴加速度传感器。实验台分别采集了在负载扭矩为0、20 N·m，转速分别为500、1 000、1 500、2 000、2 500、3 000、3 500、4 000 r/min工况下的不同故障数据，故障诊断泛化任务仅使用了部分工况数据。电机启动驱动水平轴旋转，通过中间减速器功率传递到尾部斜轴，接着功率流过尾部减速器到达尾桨轴，尾部的磁粉制动器模拟在运行过程中的负载效应。当某个工况稳定运行下，采集30 s的振动数据，使用电脑端的采集程序保存数据，并通过控制柜关闭电源，替换故障件，重复进行以上实验。

显示原图|下载原图ZIP|生成PPT

图 7 直升机尾传动系统实验台

Fig.7 Test bench of helicopter tail transmission system

为了验证基于动力学生成的域泛化故障诊断方法的有效性，采集了4个零部件的8种故障类型，零部件故障类型如图8所示。故障类型包括轴承外圈轻度和重度裂纹，内圈轻度裂纹，内圈轻度和重度磨损，空心轴裂纹，外花键磨损，联轴器裂纹。

显示原图|下载原图ZIP|生成PPT

图 8 真实与虚拟故障设置

Fig.8 Real and virtual fault settings

为了验证基于动力学机理的数据生成方法的有效性和精确性，对比了轴承内外圈、联轴器及空心轴裂纹4种故障下的测试振动响应和动力学振动响应结果。以3 000 r/min、20 N·m运行工况为响应对比试验工况，给出了4种单一故障不同方位的振动频域响应对比，如图9所示。

显示原图|下载原图ZIP|生成PPT

图 9 频域成分对比

Fig.9 Frequency domain component comparison

图9显示了不同健康状态下的径向振动频率成分，可看出相同测点的x、y方向的频率成分基本一致。由于不同的振动传递路径，传感器1和传感器2位置的振动频率成分有明显的差异，传感器2有更多的频率成分，可能是在靠近齿轮箱的地方有更多的噪声。健康状态下2个传感器不同方位均体现出较大转频f_r 和啮频f_m 幅值。然而，当存在轴、叠片联轴器裂纹的时候，频率成分主要表现为转频f_r，及其倍频2f_r 、3f_r 、4f_r 、5f_r 、6f_r，还有啮频成分f_m 和倍频2f_m，另外还发现f_m ±f_r 和2f_m ±f_r 边频成分。所以这2种的频率成分类似，对其故障分类是比较困难的。当存在轴承内圈裂纹的时候，频率成分主要表现为转频f_r，及其倍频2f_r 、3f_r 、4f_r 、5f_r 、6f_r，还有啮频成分f_m 和倍频2f_m，另外还发现f_m ±f_r 和2f_m ±f_r 边频成分，另外还体现出轴承内圈故障频率f_bi，令人意外的是传感器3y方位并没有体现出f_bi，这可能是因为噪声淹没了该频率成分。当存在轴承外圈裂纹的时候，频率成分主要表现为转频f_r，及其倍频2f_r 、3f_r 、4f_r 、5f_r 、6f_r，还有啮频成分f_m 和倍频2f_m，另外还体现出轴承外圈故障频率f_bo。可以看出当长轴、轴承、花键及联轴器发生故障时，会引入转频的高次谐波、啮频的高次谐波及其两者的调制频率成分，使得频率成分更加复杂，导致故障分类任务更具挑战性。

从图10中可以看出：无论那种故障形式，振动加速度RMS值随着转速的升高而变大。但是不同传感器的不同方位的RMS值变化的趋势缓急有明显区别。可以看a ₃ _z 的变化趋势最急，相反a ₂ _y 的变化趋势最平缓。不同传感器的数据具有不同的振动响应统计特征，因此在故障诊断分类的时候，有必要同时考虑不同传感器的振动数据。

显示原图|下载原图ZIP|生成PPT

图 10 振动加速度均方根演化

Fig.10 RMS evolution of vibration acceleration

3.2 故障数据集设置

为了验证提出的直升机尾传动系统故障诊断方法的有效性，使用2个不同的故障数据集进行验证，故障类型如表1所示。一个私有数据集来自重庆大学直升机传动系统测试平台，另一个公开数据集是来自西储大学的开放数据集。直升机尾传动测试台的故障数据采集设置见图7和图8。西储大学轴承故障数据集详细设置见文献［39］。

表1 故障数据集设置

Table 1 Fault dataset setup

数据集名称	数据集简称	故障全称	故障简称	转速-负载
重庆大学直升机数据集	数据集A	健康	HY	1 000 r/min-0（N·m） 1 000 r/min-20（N·m） 3 000 r/min-0（N·m） 3 000 r/min-20（N·m）
		轴承外圈轻度裂纹	OLC
		轴承外圈重度裂纹	OHC
		轴承内圈轻度裂纹	ILC
		轴承内圈轻度磨损	ILW
		轴承内圈重度磨损	IHW
		空心轴裂纹	HSC
		外花键磨损	ESW
		联轴器裂纹	CC
西储大学轴承数据集	数据集B	健康	HY	1 797 r/min-0（HP） 1 772 r/min-1（HP） 1 750 r/min-2（HP） 1 730 r/min-3（HP）
		轴承内圈轻度故障	ILF
		轴承内圈中度故障	IMF
		轴承内圈重度故障	IHF
		轴承外圈轻度故障	OLF
		轴承外圈中度故障	OMF
		轴承外圈重度故障	OHF
		轴承滚珠轻度故障	BLF
		轴承滚珠中度故障	BMF
		轴承滚珠度故障	BHF

表1设置了重庆大学直升机数据集、西储大学轴承数据集2个数据集。前者共有9种故障类型与4种工况；而后者共有10种故障类型与4种工况。

3.3 泛化任务与运行设置

基于表1的故障设置，接着给出了域泛化任务，详细设置见表2，包括重庆大学数据集和西储大学数据集泛化任务，2个泛化任务的源域均为仿真数据，目标域为测试数据，源域均为3个工况的数据，目标域均为一个工况的数据。

表2 泛化任务设置

Table 2 Generalization task setting

数据集	泛化任务	源域（仿真域）工况	目标域（测试域）工况	源域（仿真域）标签	目标域（测试域）标签
重庆大学数据集	T1	1 000-20， 3 000-0， 3 000-20	1 000-0	2，3，4	1
	T2	1 000-0， 3 000-0， 3 000-20	1 000-20	1，3，4	2
	T3	1 000-0， 1 000-20， 3 000-20	3 000-0	1，2，4	3
	T4	1 000-0， 1 000-20， 3 000-0	3 000-20	1，2，3	4
西储大学数据集	T1	1 797-0， 1 772-1， 1 750-2	1 730-3	2，3，4	1
	T2	1 797-0， 1 772-1， 1 730-3	1 750-2	1，3，4	2
	T3	1 797-0， 1 750-2， 1 730-3	1 772-1	1，2，4	3
	T4	1 772-1， 1 750-2， 1 730-3	1 797-0	1，2，3	4

本文的故障诊断泛化任务使用PyTorch深度学习框架在配置有英伟达GeForce RTX 3080 GPU和128 GB内存的计算机上实现。损失函数为CrossEntropy，优化算法为Adam，初始学习率为0.01，采用指数衰减策略。训练批次大小为256，训练迭代总数为200。损失函数超参数λ ₁和λ ₂分别设置为0.02、0.4。泛化任务中选择了4种经典方法作为基准，分别是领域对抗神经网络（Domain Adversarial Neural Networks， DANN）^［40］、深度相关对齐（Deep CORrelation ALignment， DCORAL）^［41］、带中心损失卷积神经网络（Convolutional Neural Networks with Center loss， CNN-C）^［42］和条件对比域泛化（Conditional Contrastive Domain Generalization， CCDG）^［43］。

3.4 实验结果分析与讨论

本节给出2个数据集下5种域泛化模型的对比实验结果与分析，随后给出提出模型AMFGDG的消融实验，验证模型每部分的有效性，最后给出超参数的敏感影响分析，分析出模型最佳超参数的组合。

3.4.1 诊断结果对比分析

表3和图11展示了2个数据集中各域泛化方法的目标域精度。从表3中可得，提出模型AMFGDG在不同泛化任务上均取得最卓越的诊断结果。在数据集A上，相对于DANN、DCORAL、CNN-C、CCDG这4种方法，提出模型AMFGDG的平均精度分别提升了8.44%、12.50%、6.98%和6.36%；在数据集B上，提出模型的平均精度提升更为显著，分别为31.44%、18.74%、14.88%和15.56%。另外，2个数据集的不同泛化任务显示，高转速到低转速比低转速到高转速的泛化能力强，这是因为高转速下系统呈现的频率成分更加丰富，传动系统响应非线性更强。

表3 诊断精度对比

Table 3 Comparison of diagnostic accuracy

数据集名称	泛化任务	目标域精度/%
数据集名称	泛化任务	DANN	DCORAL	CNN-C	CCDG	AMFGDG
数据集A	T1	66.92	58.75	67.72	67.28	71.9
	T2	60.16	60.36	66.85	69.78	70.65
	T3	74.70	73.51	74.78	73.49	81.87
	T4	84.27	75.20	82.56	83.85	95.40
数据集B	T1	50.54	71.11	77.62	75.62	86.32
	T2	55.52	70.43	69.86	70.04	82.59
	T3	56.82	66.34	67.50	67.77	90.18
	T4	56.71	64.52	74.86	73.66	88.25

显示原图|下载原图ZIP|生成PPT

图 11 不同任务精度对比

Fig.11 Comparison of accuracy of different tasks

图12给出了在数据集A中泛化任务T4中不同域泛化方法的精度曲线。从精度对比曲线可以看出，AMFGDG方法在训练过程中始终保持领先，最终精度显著高于其他4种域泛化方法，表现出更优的收敛速度和泛化性能。

显示原图|下载原图ZIP|生成PPT

图 12 不同方法精度曲线

Fig.12 Accuracy curves of different methods

进一步的，为了更加生动形象反应各模型的故障诊断性能，给出了不同故障诊断方法在数据集A中泛化任务T4的可视化结果。图13、图14分别展示了t-SNE图、混淆矩阵图。

显示原图|下载原图ZIP|生成PPT

图 13 不同诊断方法的t-SNE

Fig.13 t-SNE of different diagnostic methods

显示原图|下载原图ZIP|生成PPT

图 14 不同诊断方法的混淆矩阵

Fig.14 Confusion matrix of different diagnostic methods

图13中，AMFGDG方法在目标域特征空间中表现出最佳的聚类分布和判别性，有效实现了不同故障类型的分离，显著优于其他4种域泛化方法。CCDG方法中，ILC故障特征簇明显分离，且它与IHW故障特征有部分重叠。CNN-C方法中，IHW、HY、HSC和OHC这4种故障特征簇明显分开，CC和OLC有少许重叠。DANN方法不同故障的边界没有明显区分开。DCORAL方法中仅OLC和ILC故障与其他故障存在明显边界。提出方法AMFGDG存在特征簇紧凑且边界明显分开的特点。

图14分析混淆矩阵可以发现，AMFGDG方法在所有故障类型上基本上表现出优异的分离效果，其分类结果明显优于其他方法，尽管提出方法在故障类型HSC的准确率只有65%。相比之下，DANN和CCDG也取得不错的分类效果，即使前者存在OHC故障类型的分类精度仅为37%，后者存在HSC故障类型的分类精度仅为47%。CNN-C方法相对于上面2种方法，诊断精度明显下降，而方法DCORAL则是取得了最差的诊断结果，其中有4种故障分类精度均低于60%。

3.4.2 提出模型消融实验

本节给出提出模型的详细消融实验设置与分析。消融模型实验设置为：模型A（L _LMMD与L _clust损失函数均无）、模型B（仅存在L _LMMD损失函数）、模型C（仅存在L _clust损失函数）和提出的模型（L _LMMD与L _clust损失函数都有），不同消融模型的诊断精度结果见表4。

表4 不同消融模型精度对比

Table 4 Comparison of accuracy of different ablation models

模型	模型A	模型B	模型C	提出模型
精度/%	76.28	84.67	94.78	95.40

表4显示提出模型的精度（95.40%）在所有模型中最高，分别比模型A、模型B和模型C提升了19.12%、10.73%、0.62%，说明其具有显著的性能优势。仅有L _LMMD损失函数的模型B精度高于仅有L _clust损失函数的模型C，说明全局分布对齐相对于局部聚类的作用更重要。L _LMMD与L _clust损失函数均不考虑的模型性能最差。

图15显示提出模型在所有故障类型上都能实现接近完美的区分效果，每一类别的AUC值均超过0.936，其中大部分类别甚至达到1.0，整体micro-avg的AUC高达0.993，反映出其出色的泛化性能与稳健性。2种损失均不考虑的消融模型A是性能最差的，micro-avg的AUC为0.962。仅考虑L _clust的消融模型C的性能有少许提升，micro-avg的AUC为0.966，且故障类型HY出现明显波动。仅考虑L _LMMD的消融模型B的性能有进一步提升，micro-avg的AUC高达0.971。

显示原图|下载原图ZIP|生成PPT

图 15 不同消融模型的ROC曲线

Fig.15 ROC curves of different ablation models

3.4.3 超参数影响分析

本节分析了样本划分比例和图卷积网络层数2种超参数对模型的影响，如图16和17所示。图16显示随着样本划分比例的增加，模型的精度持续显著提升。当样本划分从0.5提高到0.8时，精度由77.56%上升至95.40%，表现出较为线性的上升趋势。这表明，增加训练样本数量能够有效提升模型的分类准确率，充分的数据支撑对模型性能的提升具有重要作用。图17显示随着网络层数的增加，模型的精度显著提升，从单层结构的59.21%提高到混合层1-2-3结构的95.40%，说明多层混合结构能够更好地提取特征、提升分类能力。然而，当网络层数进一步增加到1-2-3-4混合层时，精度仅小幅提升至95.70%，呈现出性能趋于饱和的趋势。因此，合理选择不同网络层数混合对于模型性能优化至关重要，过多的不同层数混合并不会带来明显的精度提升。

显示原图|下载原图ZIP|生成PPT

图 16 不同样本划分率的精度

Fig.16 Accuracy of different sample division ratios

显示原图|下载原图ZIP|生成PPT

图 17 不同图卷积网络层融合的精度

Fig.17 Accuracy of fusion of different graph convolutional network layers

4 结论

本文以自适应权重多级融合图网络作为特征提取器，监督分类损失、跨分布对齐损失以及深度聚类结构保持损失作为模型损失函数以更新权重系数，实现仿真域到测试域的泛化。主要结论如下：

1）基于动力学模型的数据生成方法能高精度预测物理系统的振动响应。通过仿真数据与测试数据的频率成分对比，得出提出的数据生成方法不仅能体现出丰富频率成分，还能与测试数据的主要频率成分一致。

2）提出的AMFGDG诊断模型，在2个数据集的域泛化任务上都能取得最好诊断结果。相对于其他4个域泛化模型，在数据集A上精度至少提升6.36%，在数据集B上精度至少提升15.56%。

3）消融实验验证提出的模型各个模块都是不可替代的。随后，给出了样本划分比例和图卷积网络层数对AMFGDG诊断模型的影响规律。

未来的研究工作将进一步探索基于少量标签数据的无监督学习方法，以减少对高质量标注数据的依赖，并研究如何在更复杂的工程系统中应用AMFGDG框架。

References

Publishing order | Descend order by publishing year | Descend order by cited within

[1]	ZHANG C， ZHU R P， CHEN W F， et al. Dynamic modeling and analysis of the supercritical tail drive system of a helicopter considering the mounting platform deformation［J］. Nonlinear Dynamics， 2024， 112（11）： 9063-9094.

[2]	ELASHA F， GREAVES M， MBA D. Planetary bearing defect detection in a commercial helicopter main gearbox with vibration and acoustic emission［J］. Structural Health Monitoring， 2018， 17（5）： 1192-1212.

[3]	ZHOU L， DUAN F， MBA D， et al. Using frequency domain analysis techniques for diagnosis of planetary bearing defect in a CH-46E helicopter aft gearbox［J］. Engineering Failure Analysis， 2018， 92： 71-83.

[4]	SAWALHI N， WANG W Y， BLUNT D. Helicopter planet gear rim crack diagnosis and trending using cepstrum editing enhanced with deconvolution［J］. Sensors， 2024， 24（8）： 2593.

[5]	张新，赵艺珂，王家序，等. 基于最大平均峭度盲解卷积的直升机故障诊断［J］. 振动、测试与诊断， 2024， 44（3）： 480-485， 617. ZHANG X， ZHAO Y K， WANG J X， et al. Helicopter fault diagnosis by blind deconvolution based on average kurtosis maximization［J］. Journal of Vibration， Measurement & Diagnosis， 2024， 44（3）： 480-485， 617 （in Chinese）.

[6]	KONG Y， QIN Z Y， WANG T Y， et al. Data-driven dictionary design-based sparse classification method for intelligent fault diagnosis of planet bearings［J］. Structural Health Monitoring， 2022， 21（4）： 1313-1328.

[7]	谢习华，徐雷，谭耀，等. 基于PSO-GRNN的直升机旋翼不平衡故障诊断［J］. 噪声与振动控制， 2015， 35（2）： 175-179. XIE X H， XU L， TAN Y， et al. Fault diagnosis of helicopter rotor’s unbalance based on PSO-GRNN algorithms［J］. Noise and Vibration Control， 2015， 35（2）： 175-179 （in Chinese）.

[8]	LI T F， ZHAO Z B， SUN C， et al. Adaptive channel weighted CNN with multisensor fusion for condition monitoring of helicopter transmission system［J］. IEEE Sensors Journal， 2020， 20（15）： 8364-8373.

[9]	SUN K C， YIN A J. Multisensor graph adaptive federated generalization for helicopter transmission system fault diagnosis［J］. IEEE Transactions on Instrumentation and Measurement， 2024， 73： 3524511.

[10]	余志锋，熊邦书，熊天旸，等. 基于VMD-CWT和改进CNN的直升机轴承故障诊断［J］. 航空动力学报， 2021， 36（5）： 948-958. YU Z F， XIONG B S， XIONG T Y， et al. Helicopter bearing fault diagnosis based on VMD-CWT and improved CNN［J］. Journal of Aerospace Power， 2021， 36（5）： 948-958 （in Chinese）.

[11]	李恒，唐倩，陈国旺，等. 数字孪生辅助的直升机尾传动系统轴承与传动轴故障诊断［J］. 航空动力学报， 2025， 40（6）： 20230818. LI H， TANG Q， CHEN G W， et al. Diagnosis of bearing and drive shaft faults in helicopter tail drive systems assisted by digital twin［J］. Journal of Aerospace Power， 2025， 40（6）： 20230818 （in Chinese）.

[12]	LI W， ZHONG X， SHAO H D， et al. Multi-mode data augmentation and fault diagnosis of rotating machinery using modified ACGAN designed with new framework［J］. Advanced Engineering Informatics， 2022， 52： 101552.

[13]	GUO Y， LI X Y， ZHANG J D， et al. SDCGAN： A CycleGAN-based single-domain generalization method for mechanical fault diagnosis［J］. Reliability Engineering & System Safety， 2025， 258： 110854.

[14]	LI X， ZHANG W， MA H， et al. Domain generalization in rotating machinery fault diagnostics using deep neural networks［J］. Neurocomputing， 2020， 403： 409-420.

[15]	FAN Z H， XU Q F， JIANG C X， et al. Deep mixed domain generalization network for intelligent fault diagnosis under unseen conditions［J］. IEEE Transactions on Industrial Electronics， 2024， 71（1）： 965-974.

[16]	ZHAO C， SHEN W M. A domain generalization network combing invariance and specificity towards real-time intelligent fault diagnosis［J］. Mechanical Systems and Signal Processing， 2022， 173： 108990.

[17]	SHI Y W， DENG A D， DENG M Q， et al. Domain transferability-based deep domain generalization method towards actual fault diagnosis scenarios［J］. IEEE Transactions on Industrial Informatics， 2023， 19（6）： 7355-7366.

[18]	JIA L S， CHOW T W S， YUAN Y X. Causal disentanglement domain generalization for time-series signal fault diagnosis［J］. Neural Networks， 2024， 172： 106099.

[19]	LI T F， ZHOU Z， LI S N， et al. The emerging graph neural networks for intelligent fault diagnostics and prognostics： A guideline and a benchmark study［J］. Mechanical Systems and Signal Processing， 2022， 168： 108653.

[20]	CHEN H， WANG X B， YANG Z X. Semi-supervised self-correcting graph neural network for intelligent fault diagnosis of rotating machinery［J］. IEEE Transactions on Instrumentation and Measurement， 2023， 72： 3536611.

[21]	YIN P Z， NIE J， LIANG X Y， et al. A multiscale graph convolutional neural network framework for fault diagnosis of rolling bearing［J］. IEEE Transactions on Instrumentation and Measurement， 2023， 72： 2520713.

[22]	WANG H， WANG J W， ZHAO Y K， et al. Few-shot learning for fault diagnosis with a dual graph neural network［J］. IEEE Transactions on Industrial Informatics， 2023， 19（2）： 1559-1568.

[23]	WANG Z， WU Z Y， LI X Q， et al. Attention-aware temporal-spatial graph neural network with multi-sensor information fusion for fault diagnosis［J］. Knowledge-Based Systems， 2023， 278： 110891.

[24]	LIU R N， ZHANG Q H， LIN D， et al. Causal intervention graph neural network for fault diagnosis of complex industrial processes［J］. Reliability Engineering & System Safety， 2024， 251： 110328.

[25]	LIU Z， PENG Z R. Few-shot bearing fault diagnosis by semi-supervised meta-learning with graph convolutional neural network under variable working conditions［J］. Measurement， 2025， 240： 115402.

[26]	LI C Y， MO L F， KWOH C K， et al. Noise-robust multi-view graph neural network for fault diagnosis of rotating machinery［J］. Mechanical Systems and Signal Processing， 2025， 224： 112025.

[27]	李晖，陈银超，孙绍山，等. 基于联邦图网络的转子系统故障诊断方法［J］. 航空学报， 2024， 45（17）： 530611. LI H， CHEN Y C， SUN S S， et al. Fault diagnosis method of rotor system based on federated graph network［J］. Acta Aeronautica et Astronautica Sinica， 2024， 45（17）： 530611 （in Chinese）.

[28]	QIN Y， LIU H Y， WANG Y， et al. Inverse physics-informed neural networks for digital twin-based bearing fault diagnosis under imbalanced samples［J］. Knowledge-Based Systems， 2024， 292： 111641.

[29]	YU Y N， TANG L H， LIU Z P， et al. A novel bearing fault data generation strategy combining physical modeling and CycleGAN variant for fault diagnosis without real samples［J］. IEEE Transactions on Instrumentation and Measurement， 2025， 74： 3505717.

[30]	MING Z， TANG B P， DENG L， et al. Digital twin-assisted fault diagnosis framework for rolling bearings under imbalanced data［J］. Applied Soft Computing， 2025， 168： 112528.

[31]	张锐奇，孙弋，于耀翔，等. 数模联合驱动的动态对抗自适应轴承故障诊断方法［J］. 振动与冲击， 2023， 42（12）： 256-263， 282. ZHANG R Q， SUN Y， YU Y X， et al. A new simulation-data driven dynamic adversarial adaptive fault diagnosis method for bearings［J］. Journal of Vibration and Shock， 2023， 42（12）： 256-263， 282 （in Chinese）.

[32]	于树博，刘占生，赵辰. 动力学仿真数据驱动的域自适应智能诊断方法［J］. 中国机械工程， 2023， 34（23）： 2832-2841. YU S B， LIU Z S， ZHAO C. Dynamics simulation data driven domain adaptive intelligent fault diagnosis［J］. China Mechanical Engineering， 2023， 34（23）： 2832-2841 （in Chinese）.

[33]	XU W H， WANG H， JIN J B， et al. Dynamic model-based intelligent fault diagnosis method for fault detection in a rod fastening rotor［J］. Engineering Applications of Artificial Intelligence， 2025， 139： 109499.

[34]	张龙，张号，王朝兵，等. 显式动力学驱动的轴承变工况故障诊断方法［J］. 中国机械工程， 2023， 34（8）： 982-992. ZHANG L， ZHANG H， WANG C B， et al. Explicit dynamics driving fault diagnosis method for bearing variable conditions［J］. China Mechanical Engineering， 2023， 34（8）： 982-992 （in Chinese）.

[35]	WANG H， WANG S H， YANG R G， et al. A numerical simulation enhanced multi-task integrated learning network for fault detection in rotation vector reducers［J］. Mechanical Systems and Signal Processing， 2024， 217： 111525.

[36]	肖刚，顾海瑞，董锦锦，等. 仿真数据驱动的长期服役电梯导轨故障迁移诊断方法［J］. 中国机械工程， 2024， 35（1）： 125-135. XIAO G， GU H R， DONG J J， et al. Simulation data-driven migration diagnosis method for guide rail faults in long-term service elevators［J］. China Mechanical Engineering， 2024， 35（1）： 125-135 （in Chinese）.

[37]	ZHU Y C， ZHUANG F Z， WANG J D， et al. Deep subdomain adaptation network for image classification［J］. IEEE Transactions on Neural Networks and Learning Systems， 2021， 32（4）： 1713-1722.

[38]	CARON M， BOJANOWSKI P， JOULIN A， et al. Deep clustering for unsupervised learning of visual features［C］∥Proceedings of the European Conference on Computer Vision （ECCV）. 2018： 132-149.

[39]	Smith W， Robert R. Rolling element bearing diagnostics using the Case Western Reserve University data： A benchmark study［J］. Mechanical Systems and Signal Processing， 2015， 64： 100-131.

[40]	LI H L， PAN S J， WANG S Q， et al. Domain generalization with adversarial feature learning［C］∥2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway： IEEE Press， 2018： 5400-5409.

[41]	SUN B C， SAENKO K. Deep CORAL： Correlation alignment for deep domain adaptation［C］∥Computer Vision-ECCV 2016 Workshops. Cham： Springer， 2016： 443-450.

[42]	YANG Y T， YIN J C， ZHENG H L， et al. Learn generalization feature via convolutional neural network： A fault diagnosis scheme toward unseen operating conditions［J］. IEEE Access， 2020， 8： 91103-91115.

[43]	RAGAB M， CHEN Z H， ZHANG W Y， et al. Conditional contrastive domain generalization for fault diagnosis［J］. IEEE Transactions on Instrumentation and Measurement， 2022， 71： 3506912.

Options

Outlines

模态框（Modal）标题

Abstract

Cite this article

1 相关工作

1.1 多源域泛化

图 1 多源域泛化描述

1.2 图神经网络

1.3 基于动力学的数据生成

1.4 域泛化任务定义

2 提出的AMFGDG方法

2.1 提出方法框架

图 2 提出的AMFGDG 框架

2.2 图构建策略

图 3 不同域的图构建

2.3 图特征表征网络

图 4 自适应权重多级图卷积网络

2.4 损失函数与参数更新

2.5 故障诊断流程

图 5 仿真数据生成流程图

3 故障诊断实验

3.1 故障数据生成与验证

3.1.1 高精度故障数据生成策略

图 6 直升机尾传动系统三维模型

3.1.2 故障数据精度验证

图 7 直升机尾传动系统实验台

图 8 真实与虚拟故障设置

图 9 频域成分对比

图 10 振动加速度均方根演化

3.2 故障数据集设置

表1 故障数据集设置

3.3 泛化任务与运行设置

表2 泛化任务设置

3.4 实验结果分析与讨论

3.4.1 诊断结果对比分析

表3 诊断精度对比

图 11 不同任务精度对比

图 12 不同方法精度曲线

图 13 不同诊断方法的t-SNE

图 14 不同诊断方法的混淆矩阵

3.4.2 提出模型消融实验

表4 不同消融模型精度对比

图 15 不同消融模型的ROC曲线

3.4.3 超参数影响分析

图 16 不同样本划分率的精度

图 17 不同图卷积网络层融合的精度

4 结 论

References

4 结论