基于多源域数据与机器学习算法的转子不平衡故障诊断

关晓晴; 卫炳坤; 牛东圣; 焦瀚晖; 胡东旭; 张雪辉

doi:10.13543/j.bhxbzr.2024.02.012

北京化工大学学报（自然科学版） >

2024 , Vol. 51 >Issue 2: 109 - 119

DOI: https://doi.org/10.13543/j.bhxbzr.2024.02.012

机电工程和信息科学

基于多源域数据与机器学习算法的转子不平衡故障诊断

关晓晴 ¹ ,
卫炳坤 ² ,
牛东圣 ³ ,
焦瀚晖 ² ,
胡东旭 ² ,
张雪辉 ^,²^,*

展开

1. 国华能源投资有限公司, 北京 100007
2. 中国科学院工程热物理研究所, 北京 100190
3. 中国电建集团西北勘测设计研究院有限公司, 西安 710065

张雪辉，E-mail: zhangxuehui@iet.cn

关晓晴，女，1974年生，硕士，工程师

收稿日期: 2023-05-31

网络出版日期: 2024-04-09

基金资助

内蒙古重大科技专项(2020ZD0017)

陕西省创新能力支撑计划(2023KJXX-086)

版权

收起

Rotor unbalance fault diagnosis based on multi-source domain data and machine learning algorithms

XiaoQing GUAN ¹ ,
BingKun WEI ² ,
DongSheng NIU ³ ,
HanHui JIAO ² ,
DongXu HU ² ,
XueHui ZHANG ^,²^,*

Expand

1. Guohua Energy Investment Co., Ltd., Beijing 100007
2. Institute of Engineering Thermophysics, Chinese Academy of Sciences, Beijing 100190
3. Northwest Engineering Corporation Limited, PowerChina, Xi'an 710065, China

Received date: 2023-05-31

Online published: 2024-04-09

Copyright

Fold

摘要

国内能源生产装置规模大型化发展趋势明显，与其配套的旋转机械设备发生故障导致的非计划停机将会造成严重的经济损失与重大安全问题。转子不平衡贯穿了旋转机械设备的整个生命周期，服役转子的状态诊断格外重要。针对大型旋转机械振动测点较多，振动信号具有非平稳特征等问题，提出基于多源域数据提取与机器学习算法的转子不平衡故障诊断模型。首先以多源振动监测数据为驱动，根据互相关系数提取故障信息丰富的振动信号，融合时域、频域、时频域等多域特征构建高维混合特征空间；其次利用基于t分布的随机邻域嵌入方法揭示高维空间的特征信息，反映为可视化的三维空间；最终通过最邻近节点算法进行故障分类，判断转子的不平衡质量与相位。本文提出利用互相关系数表征多源数据的故障信息丰富程度，并结合机器学习手段判断转子不平衡类型。通过设计不同附加质量的转子在多转速下不平衡状态实验，验证了所提模型的有效性，解决了转子在线诊断和现场动平衡问题。

关键词： 转子不平衡; 多源域数据; 智能故障诊断; 旋转机械

本文引用格式

关晓晴 , 卫炳坤 , 牛东圣 , 焦瀚晖 , 胡东旭 , 张雪辉 . 基于多源域数据与机器学习算法的转子不平衡故障诊断[J]. 北京化工大学学报（自然科学版）, 2024 , 51(2) : 109 -119 . DOI: 10.13543/j.bhxbzr.2024.02.012

Abstract

The trend toward large-scale development of domestic power generation equipment is evident, and unplanned downtime caused by the failure of its supporting rotating mechanical equipment will cause serious economic losses and major safety issues. Rotor imbalance runs through the entire life cycle of rotating mechanical equipment, and diagnosing the condition of an in-service rotor is particularly important. A rotor imbalance fault diagnosis model based on multi-source domain data extraction and machine learning algorithms is proposed to address the problems of large rotating machinery with multiple vibration measurement points and non-stationary vibration signals. Based on multi-source vibration monitoring data, a vibration signal with rich fault information is first extracted based on cross-correlation coefficients, and a high-dimensional mixed feature space is constructed by fusing multi-domain features such as time domain, frequency domain and time-frequency domain. Secondly, a random neighbourhood embedding method based on t-distribution is used to reveal the feature information of the high-dimensional space, which is reflected as a visualised three-dimensional space. Finally, the nearest node algorithm is used for fault classification to determine the unbalanced mass and phase of the rotor. This proposed model uses the cross-correlation coefficients to characterize the richness of fault information in multi-source data, and the combination of machine learning methods to determine the type of rotor unbalance. The effectiveness of the model was verified by designing unbalance state experiments on rotors with different additional masses at multiple speeds, solving the problems of online diagnosis and on-site dynamic balancing of rotors.

Key words： rotor imbalance; multi-source domain data; intelligent fault diagnosis; rotating machinery

引言

在“碳达峰、碳中和”的发展战略大背景下，国内能源生产行业快速发展^[1]，与之配套的高速旋转机械也向大型化、高速化和高精密方向发展。转子不平衡导致的设备非计划停机，不仅会造成经济财产损失，且可能带来灾难性的火灾、爆炸等安全事故^[2]。高速转子在出厂时需要做动平衡实验，减少由于加工制造等因素造成的工频振动。但转子在长期服役状态下，由于积碳、积垢等原因，会发生渐发性不平衡故障，或由于转子零部件脱落、叶轮上有异物附着等，发生突发不平衡故障。如何在线监测并识别转子的故障状态并识别不平衡位置是目前国内外的研究热点^[3]。

随着计算机水平的发展和传感器技术的提升，基于机器学习的智能故障诊断方法成为目前研究领域的一个热点，其在诊断过程中减弱了专家经验的影响，更符合智慧电厂的应用环境^[4]。该诊断方法的一般流程为提取信号的故障特征，采用监督学习或者无监督学习的分类器最终给出分类。许多学者利用机器学习方法在转子不平衡诊断方面做出了卓有成效的研究工作。文献[5-8]基于转子的故障类型和故障机理，利用经验特征提取和机器学习相结合的方法提高了故障诊断的精度。孙斌等^[9]提出了一种基于局部切空间排列和k最邻近节点(k-nearest neighbor，kNN)的转子故障诊断模型。万周等^[10]针对转子不同故障类型的诊断问题，提出了一种基于参数优化对称点模式分析的智能诊断方法，该方法通过卷积神经网络模型对时域信号在极坐标系的散点图进行分类，从而判别转子的故障状态。肖幸鑫等^[11]利用互补经验模态分解结合支持向量机的方法对离心泵转子进行了故障诊断。钟志贤等^[12]利用变分经验模态提取故障特征，采用模糊聚类分析判断不平衡状态，该方法可以识别变转速工况下的不平衡状态。Yan等^[13]利用振动信号产生轴心轨迹图，并引入深度置信网络模型对多源异构信息进行处理和分类，来判断转子的不平衡状态，该方法通过轴心轨迹考虑了多数据源融合问题。

文献[5-18]采用机器学习的方法为转子故障诊断的进一步研究提供了极具价值的理论与实验基础，但依然存在以下问题：(1)以上算法均是针对单一的已知故障位置的测点进行振动信号的分析，然而大型旋转机械的振动监测位点较多，如果针对每一个测点都进行数据提取，监测系统负担过大，监测成本过高；(2)特征参数受转速变化影响较大，以上文献并未对多转速状态进行分析；(3)对于工程实际而言，仅诊断出转子处于不平衡状态无法有效帮助设备的运行与维护，重点在于确定不平衡质量的位置、重量、相位等信息。

考虑到上述问题，本文提出一种基于多源域数据提取(multi-source domain data extraction, MSDDE)的高速转子不平衡故障诊断方法。首先，利用相关系数选取所有测点中的故障敏感测点，剔除冗余信息。然后，对故障敏感测点的振动数据进行时域、频域、时频域特征提取，构建高维混合空间；利用t分布的邻域随机嵌入(t-stochastic neighbor embedding，t-SNE)算法对高维特征数据进行降维和可视化。最终，采用kNN算法进行故障分类，实现故障智能识别。该算法能够有效地筛选多源测点信息，对采集的数据进行多域特征融合，从而综合智能地判断转子的故障状态。

1 多源域数据提取与机器学习算法诊断模型

1.1 多源数据筛选

机械零部件在长期服役过程中，随着运行状态劣化，其振动信号中会出现周期性的分量^[14]，自相关系数也随之增大。对于同源数据，即同一传感器在不同时间段采集的数据而言，随着设备的故障状态的劣化，其正常状态的数据与故障状态的数据的互相关系数会小于正常状态数据之间的互相关系数。因此计算得到同源数据之间的互相关系数，互相关系数较小的数据即为包含故障信息较多的数据。互相关系数计算公式如式(1)所示^[15]。

(1)

$R\left(C_{x, y}(\tau)\right)=\frac{\max \left[C_{x, y}(\tau)\right]}{\sigma_x \sigma_y}$

式中，下标x表示该传感器采集的正常振动数据，下标y表示该传感器采集的故障振动数据；

$C_{x, y}(\tau)$

表示正常振动信号与故障振动信号之间的正协方差函数；σ_x表示正常振动数据的标准差，σ_y表示故障振动数据的标准差。

$R\left(C_{x, y}(\tau)\right) \in[0, 1]$

，R越小代表相关性越差，即所存在的故障信息越多。在王庆锋等^[16]通过统计学习方法建立的机械设备健康状态评价准则中，互相关系数小于0.5时设备已偏离正常状态，因此在实际工程环境中可以选择最小互相关系数的信号源或利用文献[16]提出的机械设备健康状态评价准则对源信号进行筛选。

1.2 多域数据融合

对振动信号提取时域特征^[17]、频域特征^[18]、时频域特征^[19]是原始信号分析的常用技术手段。如表 1所示，时域特征是信号原始波形的统计学处理。1~6号特征为有量纲参数，与此时的振动幅值有较大关系，其中特征1为信号的绝对平均值，特征2表征信号的离散程度，特征3、4对冲击成分较敏感，特征4是离心机组与汽轮机组常用的监测参数，特征5、6反映振动的能量，特征7~12为无量纲参数，对故障的早期特征比较敏感，且不受转速等因素的影响^[20]。

表 1 时域特征参数

Table 1 Time domain characteristic parameters

序号	时域特征	特征表达式
1	整流平均值	$t_1=\frac{1}{N} \sum\limits_{i=1}^N\left\|x_i\right\|$
2	方差	$t_2=\sqrt{\frac{1}{N} \sum\limits_{i=1}^N\left(x_i-\bar{x}\right)}$
3	峰值	$t_3=\max \left\{\left\|x_i\right\|\right\}, (i=1, 2, \cdots, N)$
4	峰峰值	$t_4=\max \left\{x_i\right\}-\min \left\{x_i\right\}, (i=1, 2, \cdots, N)$
5	有效值	$t_5=\sqrt{\frac{1}{N} \sum\limits_{i=1}^N x_i^2}$
6	方根幅值	$t_6=\left(\frac{1}{N} \sum\limits_{i=1}^N \sqrt{\left\|x_i\right\|}\right)^2$
7	峭度	$t_7=\frac{1}{N} \sum\limits_{i=1}^N\left(\frac{x_i-\bar{x}}{\sigma}\right)^4$
8	歪度	$t_8=\frac{1}{N} \sum\limits_{i=1}^N\left(\frac{x_i-\bar{x}}{\sigma}\right)^3$
9	裕度因子	$t_9=\frac{t_3}{t_6}$
10	峰值因子	$t_{10}=\frac{t_3}{t_5}$
11	脉冲因子	$t_{11}=\frac{t_3}{t_1}$
12	波形因子	$t_{12}=\frac{t_5}{t_1}$

x为采集到的振动信号幅值，N为采样点数，σ为振动数据的标准差。

频域分析是对振动波形信号进行傅里叶变换，得到特征频率，根据故障的特征频率来判断设备的故障类型。频域特征是对振动信号的频域成分进行的统计学处理，特征指标见表 2，其中f₁表征频域信号的平均能量；f₂~f₅主要表征频域信号能量的集中程度以及能量集中的位置；f₆、f₁₀~f₁₃主要表征频域信号的频率谱功率收敛情况；f₇~f₉主要表征频域信号的频率的分布情况^[21]。

表 2 频域特征参数

Table 2 Frequency domain characteristic parameters

序号	频域特征	特征表达式
1	频谱幅值样本均值	$f_1=\frac{\sum\limits_{k=1}^K X(k)}{K}$
2	频谱幅值样本方差	$f_2=\frac{\sum\limits_{k=1}^K\left(X(k)-f_1\right)^2}{K-1}$
3	频谱幅值偏度系数	$f_3=\frac{\sum\limits_{k=1}^K\left(X(k)-f_1\right)^3}{K\left(\sqrt{f_2}\right)^3}$
4	频谱幅值峭度系数	$f_4=\frac{\sum\limits_{k=1}^K\left(X(k)-f_1\right)^4}{K f_2}$
5	平均频率	$f_5=\frac{\sum\limits_{k=1}^K\left(f_k X(k)\right)}{\sum\limits_{k=1}^K X(k)}$
6	频率均方根值	$f_6=\sqrt{\frac{\sum\limits_{k=1}^K\left(f_k X(k)\right)}{\sum\limits_{k=1}^K X(k)}}$
7	频率方差	$f_7=\sqrt{\frac{\sum\limits_{k=1}^K\left[\left(f_k-f_5\right)^2 X(k)\right]}{K}}$
8	主频带位置	$f_8=\sqrt{\frac{\sum\limits_{k=1}^K\left(f_k X(k)\right)}{\sum\limits_{k=1}^K\left(f_k^2 X(k)\right)}}$
9	频率能量集中度	$f_9=\frac{\sum\limits_{k=1}^K\left(f_k X(k)\right)}{\sqrt{\sum\limits_{k=1}^K\left(f_k^4 X(k)\right) \sum\limits_{k=1}^K X(k)}}$
10	变异系数	$f_{10}=\frac{f_6}{f_5}$
11	频率偏度	$f_{11}=\frac{\sum\limits_{k=1}^K\left[\left(f_k-f_5\right)^3 X(k)\right]}{K f_6^3}$
12	频率峭度	$f_{12}=\frac{\sum\limits_{k=1}^K\left[\left(f_k-f_5\right)^4 X(k)\right]}{K f_6^4}$
13	标准化频谱均值	$f_{13}=\frac{\sum\limits_{k=1}^K\left[\sqrt{\left\|f_k-f_5\right\|} X(k)\right]}{K \sqrt{f_6}}$

X(k)为频谱幅值，f_k为频率，K为频谱的谱线数。

大型旋转机械由于结构复杂，其采集的振动信号往往是非平稳信号，而单纯地提取时域特征、频域特征不能反映某种频率分量出现的时刻以及相应的变化情况^[22]。经验模态分解方法(empirical mode decomposition, EMD)由Huang等^[23]提出，可以揭示某种频率分量出现的时刻及其变化状况。相较于小波分解，EMD算法基于信号本身的局部特征尺度，无需设置基函数，将振动信号分解后，即可求出每一本征模态函数随时间变化的瞬时频率和瞬时幅值。对EMD分解后的振动信号求取特征值，便可提取时频域的相关特征。

图 1为本次实验转子模拟不平衡故障状态下采集的振动信号经过EMD分解后的各分量波形图。内涵模态分量(intrinsic mode functions, IMF)与残余模态分量(residual mode functions, Res)能够将原信号完全复原。振动信号经过EMD分解之后得到具有周期且逐渐平稳的子序列，该子序列又与振动原始信号特征是相互对应的。IMF分量的实际物理意义为各分量分别代表原始信号的各频率分量，并且按照从高频到低频的顺序依次排列。然而实际采用的信号不会保持完全稳定的频率和振幅。利用样本熵、相关系数以及峭度指标或其他综合性指标选择其中某一IMF分量进行重构并分析，选择结果也通常为前几阶频率变化明显的分量。从图 1中可以看出9个子分量中前3个IMF的频率是最高的并且变化也是最为明显的，后面的子分量逐渐平稳化，由此可提取前3组分量，并计算其波形的有效值，将方差、有效值、峰峰值作为时频域的特征，如表 3所示，共计9组。

显示原图|下载原图ZIP|生成PPT

图 1 IMF分量及残差时域图

Fig. 1 Time domain waveforms of each IMF and residual

表 3 时频域特征参数

Table 3 Time-frequency domain characteristic parameters

序号	时频域特征	特征表达式
1	IMF方差	$i_1=\sqrt{\frac{1}{N} \sum\limits_{i=1}^N\left(x_i-\bar{x}\right)}$
2	IMF有效值	$i_2=\sqrt{\frac{1}{N} \sum\limits_{i=1}^N x_i^2}$
3	IMF峰峰值	$i_3=\max \left\{x_i\right\}-\min \left\{x_i\right\}, i=1, 2, \cdots, N$

1.3 数据降维与可视化

对振动信号提取12个时域特征、13个频域特征、9个时频域特征后并不能直接反映转子的不平衡信息，且高维度的特征矩阵增加了分类器的计算过程，容易导致分类器陷入过拟合状态。

数据降维是利用机器学习手段，得到一组可以表示高维度信息的维度较小的变量。振动信号本身具有非线性和非平稳性，对其提取后的多域特征之间也存在非线性关系。

t-SNE算法是一种非线性的降维算法，由随机邻域嵌入算法改进而来，SNE算法更关注于映射中数据的局部结构，容易陷入局部拥挤问题且优化困难。因此，Hinton等^[24]于2008年提出了t-SNE算法，利用t分布取代原低维空间的高斯分布，通过这种方式减轻了拥挤问题。它构建了一个高维对象之间的概率分布，使得相似的对象有更高的概率被选择，因此在高维度空间中接近的类别，在低维度空间中也更靠近。式(2)表示低维空间中的联合概率分布函数q_ij，式(3)表示高维空间中的联合概率分布函数p_ij。

(2)

$q_{i j}=\frac{\left(1+\left\|y_i-y_j\right\|_2^2\right)^{-1}}{\sum\limits_{k \neq l}\left(1+\left\|y_l-y_k\right\|_2^2\right)^{-1}}$

(3)

$p_{i j}=\frac{\exp \left(-\left\|x_i-x_j\right\|^2 / 2 \sigma_i^2\right)}{\sum\limits_{k \neq i} \exp \left(-\left\|x_i-x_k\right\|^2 / 2 \sigma_i^2\right)}$

式中，y_i、y_j为低维空间中的任意点对，

$\left\|y_l-y_k\right\|$

为任意不同两点间的距离。利用KL散度评判高维度数据和低维度数据之间的分布差异，采用梯度下降法优化目标函数，如式(4)所示。

(4)

$\begin{aligned}& \frac{\delta C}{\delta y_i}=4 \sum\limits_j\left(p_{i j}-q_{i j}\right)\left(y_i-y_j\right)\left(1+\| y_i-\right. \left.y_j \|^2\right)^{-1}\end{aligned}$

1.4 故障分类与辨识

t-SNE算法作为可视化和降维手段并不能对数据的类别进行判断，因此本文利用分类算法进行故障判别。t-SNE算法本身降维后的结果为高维数据分布的低维分布，在空间上相同的分布更靠近。kNN算法的原理是当预测一个数据的类别时，采用与它最近距离的k个样本点的类别来定义，这与t-SNE降维后的相同分布的数据点更靠近的原理较接近，因此利用kNN算法来定义t-SNE算法降维后的数据类别是合理的。kNN算法判断距离的公式为

(5)

$\begin{aligned}& d(x, y)=\sqrt{\left(x_1-y_1\right)^2+\left(x_2-y_2\right)^2+\cdots+\left(x_n-y_n\right)^2}= \sqrt{\sum\limits_{i=1}^n\left(x_i-y_i\right)^2}\end{aligned}$

根据多数投票原则在所述低维特征空间中找出与待测数据特征向量最接近的k个样本点。k值是kNN算法的超参数，应小于单个样本容量且大于1。t-SNE算法不同类别的空间分布更大，因此k值的选择可以较小，根据实践经验，k值选择单个样本容量的10%即可。

1.5 模型框架

基于多源域数据提取与机器学习算法的转子不平衡诊断模型的流程图如图 2所示。首先，获取监测多个振动传感器的历史正常数据，计算各传感器历史正常数据与故障数据之间的互相关系数，选取相关度最小的传感器数据作为模型的监测数据源。然后，对该数据源的数据提取时域、频域和时频域特征，构建高维混合特征空间。最后，利用t-SNE算法对高维特征数据进行降维和可视化，在三维空间内采用kNN算法进行故障分类，输出故障类型。

显示原图|下载原图ZIP|生成PPT

图 2 基于多源域数据提取和机器学习算法的高速转子不平衡故障诊断模型流程图

Fig. 2 Flow chart of high-speed rotor unbalance fault diagnosis model based on MSDDE and t-SNE algorithm

2 实验验证

2.1 转子动力学实验

如图 3所示，转子动力学实验台由高速电机带动换挡齿轮箱与实验齿轮箱组成。高速电机通过变频器控制，转速在0~3 000 r/min可调。换挡齿轮箱与电机通过膜片式联轴器连接，低速档变速比为1 ∶1.3，高速档变速比为1 ∶2.5。换挡齿轮箱通过膜片式联轴器与传动比1 ∶5.32的实验齿轮箱连接，实验齿轮箱高速轴设计转速0~30 000 r/min。

显示原图|下载原图ZIP|生成PPT

图 3 转子不平衡模拟实验台

Fig. 3 Rotor unbalance simulation test bench

该高速轴轴端设计有两个配重轮盘，结构形式如图 4所示。通过增加配重质量块来模拟转子不同的不平衡状态。实验齿轮箱分布有8个8 mm电涡流位移传感器，传感器采样频率5 000 Hz，采样点数5 000。用于采集低速轴与高速轴振动的传感器分布如表 4所示。

显示原图|下载原图ZIP|生成PPT

图 4 配重盘结构形式

Fig. 4 Counterweight plate structure

表 4 实验齿轮箱传感器分布

Table 4 Distribution of test gearbox sensors

传感器编号	位置
A1	低速轴驱动侧+45°
A2	低速轴驱动侧-45°
A3	低速轴盲端+45°
A4	高速轴电机侧+45°
A5	高速轴电机侧-45°
A6	高速轴非电机侧+45°
A7	高速轴非电机侧-45°
A8	低速轴键相

设计3个实验如下：实验一不增加配重质量块，转子本身动平衡等级为G1.0级，按照图 5所示的高速轴升速曲线做升速实验，在各转速停留采集数据后进入下一转速；实验二在高速轴靠近电机侧的配重轮盘上的0°相位处增加3.17 g的配重质量块，按图 5所示的高速轴升速曲线升速；实验三在高速轴靠近电机侧配重轮盘上90°相位(相对于0°相位沿轴旋转方向)处增加3.17 g配重质量块，按图 5所示的高速轴升速曲线升速。

显示原图|下载原图ZIP|生成PPT

图 5 高速轴升速曲线

Fig. 5 High-speed shaft lift curve

将实验一在8 460 r/min下7个振动传感器采集的某一组信号看作正常信号，选取实验二与实验三在8 460 r/min转速下的各10组振动信号作为测试信号，计算正常信号与这10组信号的互相关系数，并求取各传感器的互相关系数平均值，结果如图 6所示。

显示原图|下载原图ZIP|生成PPT

图 6 各数据源互相关系数

Fig. 6 Correlation coefficients for each data point

从图中可以看出，A5传感器采集的振动信号与正常状态下的正常信号互相关系数最低，即信号中存在的周期性频率更高，也就意味着其包含的故障信息更丰富。此外，本次实验二与实验三增加的配重质量块位于高速轴靠近电机侧的配重盘上，A4、A5传感器更靠近故障发生位置，因此其互相关系数远低于其他传感器。A6、A7为轴另一端的传感器，其互相关系数较高，A1、A2、A3为低速轴上的传感器，其互相关系数最高。由此可以看出本文提出的利用互相关系数筛选得到故障敏感测点的方法符合实际情况，所筛选数据更靠近故障发生位置，包含故障信息更多。

2.2 同转速工况下的不平衡诊断

2.2.1 常规频谱判断

在高速轴转速为8 460 r/min时，采集实验一数据、实验二数据、实验三数据各110组。选取3组实验中A5传感器的某一时刻振动信号进行频谱分析，结果见图 7。

显示原图|下载原图ZIP|生成PPT

图 7 时域波形与频域波形图

Fig. 7 Time domain waveforms and frequency domain waveforms

从图 7可以看出，实验一与实验二、三之间振动信号差别较大，实验一振动峰峰值在20 μm，实验二与实验三振动峰峰值在30 μm。同时构成振动的主要频率分布不同，实验一的主要频率幅值较低，峰值未高于5 μm；实验二与实验三工频频率峰值为12 μm，是构成振动的主要特征频率，明显发生了不平衡故障，但实验二、三之间的频域波形一致。因此，常规频谱分析仅能判断实验二、三发生了不平衡故障，无法对不平衡故障的位置和相位进行判断。

2.2.2 基于t-SNE与kNN的模型诊断

选取实验一、二、三在8 460 r/min转速下的100组数据作为训练数据，提取时域、频域和时频域特征后，利用t-SNE算法进行降维。

如图 8所示，训练数据经过降维后3种实验数据在空间中分割开来。利用kNN算法对测试数据进行故障分类，实验一测试数据被分类为正常状态，3种测试数据更靠近各自实验组别的训练数据区域。

显示原图|下载原图ZIP|生成PPT

图 8 同转速实验数据可视化

Fig. 8 Visualization of experimental data at the same rotational speed

根据kNN算法，将30组测试数据进行分类，从分类后的混淆矩阵(图 9)可以看出，分类的准确率为100%，即相同转速下的实验数据类别都可以准确识别。

显示原图|下载原图ZIP|生成PPT

图 9 分类混淆矩阵

Fig. 9 Classification confusion matrix

2.3 不同转速工况下的不平衡诊断

对于有量纲参数，转速的变化会使数据产生较大波动。为验证模型对不同转速、不同不平衡质量的辨识有效性，设计了多转速、多不平衡质量的对比方案。该方案训练数据、测试数据的组成结构如表 5、6所示。

表 5 多转速多不平衡质量训练数据

Table 5 Training data of multi-speed and multi-unbalance

转速/(r·min^-1)	无配重	0°配重3.97 g	90°配重3.97 g
7 020	100组	100组	100组
8 460	100组	100组	100组
10 560	100组	100组	100组

表 6 多转速多不平衡质量测试数据

Table 6 Test data of multi-speed and multi-unbalance

转速/(r·min^-1)	无配重	0°配重3.97 g	90°配重3.97 g
7 020	10组	10组	10组
8 460	10组	10组	10组
10 560	10组	10组	10组

按表 5、6中数据结构提取900组数据后，计算特征并利用t-SNE算法降维与可视化。从图 10中可以看出，“▲”代表的不同转速下的正常实验数据位于三维空间的左下方，3种转速之间有一定间隔；“■”代表的“0°配重3.97 g”位于三维空间的中部；“★”代表的“90°配重3.97 g”位于三维空间的右后方。从训练数据的分布状态中可以看出，相同转速的3种实验数据在空间中分开，而相同实验的不同转速数据互相靠近。利用kNN算法对3种不平衡状态进行训练，测试数据的分类状态如图 11所示，对于不平衡状态的分类准确率为100%，表明本文提出的方法对转速并不敏感，融合后的多域特征表达了故障状态。

显示原图|下载原图ZIP|生成PPT

图 10 不同转速实验数据可视化

Fig. 10 Visualization of experimental data at different rotational speeds

显示原图|下载原图ZIP|生成PPT

图 11 实际类别与预测类别对比

Fig. 11 Comparison of actual categories and predicted categories

2.4 性能分析

为了进一步验证基于多源域数据与机器学习算法的高速转子不平衡故障诊断模型性能，设计实验与其他算法进行对比。

2.4.1 不同数据源之间的对比

采集互相关系数较高的低速轴驱动侧传感器A2、低速轴非驱动侧传感器A3的振动数据，提取多域特征后进行t-SNE降维与kNN分类处理。不同数据源的分类识别准确度如图 12和表 7所示，可以看出A2、A3数据源的识别准确度低于A5数据源。由此可得出，多源数据的选择是影响模型准确率的关键性因素，本文提出的利用互相关系数来选择数据源进行分类的方法的准确率更高。同时，3组信号源对于正常数据均判断正确，对于故障数据的判别，A2、A3数据源对不平衡相位之间识别的判断较差。

显示原图|下载原图ZIP|生成PPT

图 12 不同数据源之间的对比

Fig. 12 Comparison between different data sources

表 7 不同数据源的分类识别准确度

Table 7 Classification recognition accuracy for different data sources

数据源	总体准确率/%	正常状态识别为不平衡状态组数	不平衡状态识别为正常组数	不平衡状态之间识别错误组数
A2+t-SNE+kNN	93.3	0	0	5
A3+t-SNE+kNN	82.2	0	0	16
A5+t-SNE+kNN	100	0	0	0

2.4.2 不同分类算法之间的对比

对A5传感器采集的数据，提取多域特征值后采用随机森林算法、主成分分析(principal component analysis，PCA)+kNN算法进行分类。从图 13和表 8中可以看出，同数据源情况下，基于t-SNE与kNN算法的分类识别准确度高于其他两种算法，另外两种分类算法对不同不平衡状态之间的识别存在错误。

显示原图|下载原图ZIP|生成PPT

图 13 不同分类算法之间的对比

Fig. 13 Comparison between different classification algorithms

表 8 不同算法的分类识别准确度

Table 8 Classification recognition accuracy for different algorithms

分类算法	总体准确度/%	正常状态识别为不平衡状态组数	不平衡状态识别为正常组数	不平衡状态之间识别错误组数
A5+ PCA +kNN	97.8	0	0	2
A5+随机森林	97.8	0	0	2
A5+ t-SNE+kNN	100	0	0	0

2.4.3 参数敏感性分析

机器学习方法分类准确度容易受参数的影响，本文采用的t-SNE+kNN算法涉及到的参数有t-SNE算法的分类维度与kNN算法的k值大小。分类维度由于可视化要求一般选择2维或3维，经计算两种分类维度的准确率均为100%，因此可根据需求选取。对于k值的选择，本文推荐为样本容量的10%，一方面减小了计算复杂度，另一方面不会影响分类准确度。如图 14所示，计算了k值从1到300时的分类识别准确度。可以看出，随着k值从1增至199，识别准确度并不随着k值选择而变化；当k值在200以上取值时，样本准确度逐渐下降。综合考虑计算复杂度与准确度，本文推荐k值选择为样本容量的10%。

显示原图|下载原图ZIP|生成PPT

图 14 k值变化对准确度的影响曲线

Fig. 14 Influence curve of k-value change on accuracy

3 结论

(1) 本文提出利用互相关系数来表征故障信息的丰富程度，解决了大型转子振动测点多、多源信息识别困难等问题。对多源数据筛选后，提取时域、频域和时频域特征，构造高维度的特征空间。利用t-SNE算法揭示高维数据在低维空间的分布，通过kNN算法实现故障的智能分类与诊断。对比其他数据源采集的信息，故障诊断准确率更高，证明该方法提取的数据源包含的故障信息更多。

(2) 提出的分类模型对不同转速、不同程度的不平衡量均有良好的识别效果。通过实验对比其他转子不平衡诊断模型，所提模型具有更高的准确率，能够识别不同转速下的不平衡故障，具有更好的鲁棒性。

本文提出的方法能够判断设备的不平衡故障，随着模型库的丰富，对不平衡质量与相位的识别可用于指导现场动平衡工作的开展。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

1	陈海生, 李泓, 马文涛, 等. 2021年中国储能技术研究进展[J]. 储能科学与技术, 2022, 11 (3): 1052- 1076. CHEN H S , LI H , MA W T , et al. Research progress of energy storage technology in China in 2021[J]. Energy Storage Science and Technology, 2022, 11 (3): 1052- 1076.

2	卫炳坤. 旋转机械预测性维修支撑技术研究[D]. 北京: 北京化工大学, 2021. WEI B K. Research on predictive maintenance support technology for rotating machinery[D]. Beijing: Beijing University of Chemical Technology, 2021. (in Chinese)

3	张雪辉, 焦瀚晖, 胡东旭, 等. 旋转机械现场动平衡方法研究进展[J]. 机电工程, 2021, 38 (11): 1367- 1377. ZHANG X H , JIAO H H , HU D X , et al. Research progress on field dynamic balancing method of rotating machinery[J]. Journal of Mechanical & Electrical Engineering, 2021, 38 (11): 1367- 1377.

4	徐波. 基于机器学习的旋转机械故障诊断方法的研究[D]. 武汉: 武汉科技大学, 2019. XU B. Research on fault diagnosis of rotating machinery method based on machine learning[D]. Wuhan: Wuhan University of Science and Technology, 2019. (in Chinese)

5	李谦. 基于深度学习的转子故障诊断研究[D]. 宜昌: 三峡大学, 2021. LI Q. Research on fault diagnosis of rotor based on deep learning[D]. Yichang: China Three Gorges University, 2021. (in Chinese)

6	王煜轩. 基于循环神经网络的转子系统故障诊断方法研究[D]. 郑州: 河南工业大学, 2022. WANG Y X. Study on fault diagnosis method of rotor system based on recurrent neural network[D]. Zhengzhou: Henan University of Technology, 2022. (in Chinese)

尹项根, 乔健, 贺儒飞, 等. 基于FFT-LSTM的变速抽蓄机组转子绕组短路故障和偏心故障诊断方法[J]. 电力系统保护与控制, 2023, 51 (6): 73- 81.

YIN

X G

, QIAO

, HE

R F

, et al. FFT-LSTM-based fault diagnosis method for a rotor winding short circuit fault and rotor eccentricity fault of a variable-speed pumped storage unit[J]. Power System Protection and Control, 2023, 51 (6): 73- 81.

8	杨敬娜, 郝克明, 朱霄珣, 等. 激励下齿轮-转子系统故障模糊C聚类诊断[J]. 机械设计与制造, 2023, (4): 296- 299. YANG J N , HAO K M , ZHU X X , et al. Fuzzy C-clustering diagnosis of gear-rotor system fault under excitation[J]. Machinery Design & Manufacture, 2023, (4): 296- 299.

9	孙斌, 刘立远, 牛翀. 基于局部切空间排列和K-最近邻分类器的转子故障诊断方法[J]. 中国机械工程, 2015, 26 (1): 74- 78. SUN B , LIU L Y , NIU C . Rotor fault diagnosis methods based on local tangent space alignment and K-nearest neighbor[J]. China Mechanical Engineering, 2015, 26 (1): 74- 78.

10	万周, 何俊增, 姜东, 等. 基于参数优化SDP分析的转子故障诊断方法[J]. 振动与冲击, 2023, 42 (1): 81- 88. WAN Z , HE J Z , JIANG D , et al. Rotor fault diagnosis method based on parametric optimization SDP analysis[J]. Journal of Vibration and Shock, 2023, 42 (1): 81- 88.

11	肖幸鑫, 宋礼威, 张翊勋, 等. 基于CEEMD与SVM的离心泵转子不对中故障诊断方法研究[J]. 流体机械, 2022, 50 (7): 85- 92. XIAO X X , SONG L W , ZHANG Y X , et al. Research on fault diagnosis method of centrifugal pump rotor misalignment based on CEEMD and SVM[J]. Fluid Machinery, 2022, 50 (7): 85- 92.

12	钟志贤, 马李奕, 蔡忠侯, 等. 基于VMD_MPE和FCM聚类的变转速工况下转子不平衡故障诊断方法[J]. 振动与冲击, 2022, 41 (14): 290- 298. ZHONG Z X , MA L Y , CAI Z H , et al. Method of rotor unbalance fault diagnosis under variable-speed conditions based on VMD_MPE and FCM clustering[J]. Journal of Vibration and Shock, 2022, 41 (14): 290- 298.

13	YAN J H , HU Y Y , GUO C Z . Rotor unbalance fault diagnosis using DBN based on multi-source heterogeneous information fusion[J]. Procedia Manufacturing, 2019, 35, 1184- 1189. DOI

14	屈梁生, 何正嘉. 机械故障诊断学[M]. 上海: 上海科学技术出版社, 1986. QU L S , HE Z J . Mechanical fault diagnosis[M]. Shanghai: Shanghai Scientific & Technical Publishers, 1986.

15	何正嘉, 曹宏瑞, 訾艳阳, 等. 机械设备运行可靠性评估的发展与思考[J]. 机械工程学报, 2014, 50 (2): 171- 186. HE Z J , CAO H R , ZI Y Y , et al. Developments and thoughts on operational reliability assessment of mechanical equipment[J]. Journal of Mechanical Engineering, 2014, 50 (2): 171- 186.

16	王庆锋, 李中, 许述剑, 等. 基于故障案例学习的设备健康评价方法研究[J]. 机械工程学报, 2020, 56 (20): 28- 37. WANG Q F , LI Z , XU S J , et al. Research on equipment health evaluation method based on fault case learning[J]. Journal of Mechanical Engineering, 2020, 56 (20): 28- 37.

17	马慧. 基于状态的滚动轴承寿命预测与维修计划优化研究[D]. 北京: 北京交通大学, 2017. MA H. Research of the residual useful life prediction and maintenance optimization based on service status for rolling bearings[D]. Beijing: Beijing Jiaotong University, 2017. (in Chinese)

18	王磊, 张清华, 马春燕, 等. 故障诊断中无量纲指标研究综述[J]. 信息技术, 2014, (2): 19- 22. WANG L , ZHANG Q H , MA C Y , et al. Summary on dimensionless indicators in fault diagnosis technology[J]. Information Technology, 2014, (2): 19- 22.

19	HU Q , HE Z J , ZHANG Z S , et al. Fault diagnosis of rotating machinery based on improved wavelet package transform and SVMs ensemble[J]. Mechanical Systems and Signal Processing, 2007, 21 (2): 688- 705. DOI

20	TUCKER S , BROWN G J . Classification of transient sonar sounds using perceptually motivated features[J]. IEEE Journal of Oceanic Engineering, 2005, 30 (3): 588- 600. DOI

21	沙美妤, 刘利国. 基于振动信号的轴承故障诊断技术综述[J]. 轴承, 2015, (9): 59- 63. SHA M Y , LIU L G . Review on fault diagnosis technology for bearings based on vibration signal[J]. Bearing, 2015, (9): 59- 63.

22	焦瀚晖. 基于混合域特征及卷积神经网络的离心泵故障诊断方法研究[D]. 北京: 北京化工大学, 2020. JIAO H H. Research on fault diagnosis method of centrifugal pump based on mixed domain feature and CNN[D]. Beijing: Beijing University of Chemical Technology, 2020. (in Chinese)

23	HUANG N E , SHEN Z , LONG S R , et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society A-Mathematical Physical & Engineering Sciences, 1998, 454, 903- 995.

24	VAN DER MAATEN , HINTON G . Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9, 2579- 2605.

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

引言

1 多源域数据提取与机器学习算法诊断模型

1.1 多源数据筛选

1.2 多域数据融合

表 1 时域特征参数

表 2 频域特征参数

图 1 IMF分量及残差时域图

表 3 时频域特征参数

1.3 数据降维与可视化

1.4 故障分类与辨识

1.5 模型框架

图 2 基于多源域数据提取和机器学习算法的高速转子不平衡故障诊断模型流程图

2 实验验证

2.1 转子动力学实验

图 3 转子不平衡模拟实验台

图 4 配重盘结构形式

表 4 实验齿轮箱传感器分布

图 5 高速轴升速曲线

图 6 各数据源互相关系数

2.2 同转速工况下的不平衡诊断

2.2.1 常规频谱判断

图 7 时域波形与频域波形图

2.2.2 基于t-SNE与kNN的模型诊断

图 8 同转速实验数据可视化

图 9 分类混淆矩阵

2.3 不同转速工况下的不平衡诊断

表 5 多转速多不平衡质量训练数据

表 6 多转速多不平衡质量测试数据

图 10 不同转速实验数据可视化

图 11 实际类别与预测类别对比

2.4 性能分析

2.4.1 不同数据源之间的对比

图 12 不同数据源之间的对比

表 7 不同数据源的分类识别准确度

2.4.2 不同分类算法之间的对比

图 13 不同分类算法之间的对比

表 8 不同算法的分类识别准确度

2.4.3 参数敏感性分析

图 14 k值变化对准确度的影响曲线

3 结论

参考文献

联系我们