随着现代工业的快速发展,工业生产的安全性与可靠性变得尤为重要。近年来,以故障检测为主导的过程监测技术与方法成为学术界和工业界的研究热点。目前的故障检测方法主要分为以下3类:基于数学模型的故障检测方法,基于定性知识的故障检测方法和基于数据驱动的故障检测方法。其中基于数据驱动的故障检测方法与基于数学模型的故障检测方法相比,不需要精准的系统模型,同时随着传感器技术的飞速发展,海量数据的获得也变得更加容易,因此基于数据驱动的故障检测方法扮演着愈加重要的角色[1]。主成分分析(principal component analysis, PCA)作为一种基于数据驱动的故障检测算法,由于其简便的算法流程及对高维数据的高效处理能力而受到广泛的关注与研究[2],相关的拓展算法包括概率PCA (probability PCA)[3]、核PCA (kernel PCA)[4]、动态PCA (dynamic PCA)[5]等。
尽管对于PCA算法的各种改进有很多,但针对其中主元的选取及后续的处理问题仍然需要更加深入的研究。传统的主元选取方法有累计方差贡献法(cumulative percent variance, CPV)[6], 重构误差方差法(variance of the reconstruction error, VRE)[7]和平均特征值法(average eigenvalue, AE)[8]等。这些方法都是认为较大方差所对应的主元包含更多的信息,而较小的方差所对应的主元则常常被忽视。Jolliffe[9]提出具有较小方差的主元和具有较大方差的主元同等重要,Togkalidou等[10]指出具有较大方差的主元不一定具有最多的信息量。因此,仅凭方差的贡献度大小来确定主元的方法过于主观机械,有可能造成有用信息的丢失。同时,传统主元选取方法根据正常工况数据进行线下建模,没有考虑故障样本对建模的影响。上述问题都会导致故障检测性能的大幅下降。为此,陶阳等[11]将RelifeF算法与PCA算法相结合,从故障特征角度出发,避免了主元选取时的主观性。Jiang等[12]统计单个主元T2统计量的变化率,通过选取与监测敏感主元进行故障检测,但在选取主元阶段仍采用传统的CPV方法,导致有用信息丢失,从而影响检测效果。仓文涛等[13]通过构造累计T2统计量的变化率来体现主元的变异程度,但是传统T2统计量要求数据变量服从正态分布,而实际工业流程中采集到的数据显然很难满足此限制条件。同时从几何角度来看,T2统计量实质上是一个椭圆形控制边界,误差较大。Song等[14]提出全变量表达(full variable expression, FVE)的主元选取方法,选取对各个变量解释性最大的主元作为关键主元,保留了所有变量信息,取得了良好的故障检测效果。但该方法仍然是依据T2统计量的形式构造相应的统计量进行检测;其次,上述所有方法都是同等看待被选主元。实际上,故障发生时只有某些主元含有与故障相关的重要信息,这些主元在后续处理中需要加以突出。海林格距离(Hellinger distance, HD)是信息论中的一个概念,在统计学和概率学中用来衡量两个概率密度分布间的差异。在故障检测领域,Jiang等[15]将HD用于变量块的划分,将拥有相似概率密度分布的变量归结到同一个分块进行故障检测;Harrou等[16]将HD作为统计量,用来监测非线性投影产生残差的概率密度分布;Chen等[17]将HD用于高速列车的故障检测,相关实验表明HD作为散度的一种,有着比Kullback-Leibler(K- L)散度更好的检测效果。
局部离群因子(local outlier factor, LOF) 由Breunig等[18]提出,用于搜寻数据中的离群点。该方法利用样本点的局部离群因子值的大小来衡量其离群程度,对于样本数据的分布没有要求。故障样本相对于正常样本即可视为离群点,因此该算法已开始被研究者运用到故障检测领域。Lee等[19]将LOF算法与独立元分析法相结合,用于解决数据高斯与非高斯混合分布情况下的故障检测问题,突破了传统独立元分析法对于非高斯分布数据的限制。Deng等[20]利用双加权策略改进核主元分析法,并将其与LOF算法相结合,兼顾了工业过程的非线性特点以及数据的非高斯分布。冯立伟等[21]提出基于时空近邻标准化(time-space nearest neighborhood standardization, TSNS)- LOF的故障检测方法,提高了对于多模态过程的故障检测能力。由以上文献可以看出,将LOF算法融入到故障检测方法中并且构建相应的统计量,有利于提高故障检测能力。
本文在FVE方法基础上,利用海林格距离变化率对故障的敏感性提出一种基于全变量表达和海林格距离的故障检测算法(Hellinger distance weighted full variable expression-Mahalanobis distance LOF, HDWFV E- MDLOF)。首先利用FVE的主元选取方法有效地保留了全部变量信息,之后提出基于海林格距离变化率的指标,突出故障相关主元;同时,考虑到数据变量的无特定分布以及尺度问题,将加权后的关键主元作为改进LOF算法的输入,构造相应统计量进行故障检测。数值仿真实例和带钢热连轧实际生产数据验证了所提方法的有效性与优越性。
1 PCA算法及海林格距离 1.1 PCA算法PCA是一种用于多变量统计过程监控的基本方法,其具体实施步骤如下。给定一个原始数据矩阵X ∈ Rn×m, 其中n为样本数,m为变量数(传感器个数),其协方差矩阵为
$ \mathit{\boldsymbol{S}} = \frac{1}{{n - 1}}{\mathit{\boldsymbol{X}}^{\rm{T}}}\mathit{\boldsymbol{X}} $ | (1) |
接下来对协方差矩阵进行奇异值分解(SVD)
$ \mathit{\boldsymbol{S}} = \mathit{\boldsymbol{P \boldsymbol{\varLambda} }}{\mathit{\boldsymbol{P}}^{\rm{T}}} $ | (2) |
其中,
$ \mathit{\boldsymbol{P}} = [{\mathit{\boldsymbol{P}}_{{\rm{pc}}}}{\mathit{\boldsymbol{P}}_{{\rm{res}}}}], \mathit{\boldsymbol{ \boldsymbol{\varLambda} }} = \left[ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{ \boldsymbol{\varLambda} }}_{{\rm{pc}}}}}&0\\ 0&{{\mathit{\boldsymbol{ \boldsymbol{\varLambda} }}_{{\rm{res}}}}} \end{array}} \right] $ | (3) |
式中,Λpc=diag(λ1, λ2,…, λl),Λres=diag(λl+1, λl+2,…, λm),P为负载矩阵,Λ为特征值矩阵;l作为主元个数将负载矩阵划分成两部分,即主元空间的Ppc和残差空间的Pres。l由累计方差贡献率(CPV)确定
$ \frac{{\sum\limits_{i = 1}^l {{\lambda _i}} }}{{\sum\limits_{i = 1}^m {{\lambda _i}} }} \times 100\% \ge 85\% $ | (4) |
根据以上描述,样本X ∈ R n×m可以被分解为
$ \mathit{\boldsymbol{X}} = \mathit{\boldsymbol{\hat X}} + \mathit{\boldsymbol{\tilde X}} = \mathit{\boldsymbol{T}}{\mathit{\boldsymbol{P}}_{{\rm{pc}}}} + \mathit{\boldsymbol{\tilde X}} $ | (5) |
式中,
在PCA分解后的两个空间里分别建立T2统计量与平方预测误差(squared prediction error, SPE)统计量
$ {T^2} = {\mathit{\boldsymbol{X}}^{\rm{T}}}{\mathit{\boldsymbol{P}}_{{\rm{pc}}}}{\mathit{\boldsymbol{ \boldsymbol{\varLambda} }}^{ - 1}}\mathit{\boldsymbol{P}}_{{\rm{pc}}}^{\rm{T}}\mathit{\boldsymbol{X}} $ | (6) |
$ {E_{{\rm{SPE}}}} = \mathit{\boldsymbol{X}}(\mathit{\boldsymbol{I}} - {\mathit{\boldsymbol{P}}_{{\rm{pc}}}}\mathit{\boldsymbol{P}}_{{\rm{pc}}}^{\rm{T}}){\mathit{\boldsymbol{X}}^{\rm{T}}} $ | (7) |
T2统计量反映的是主元空间的变化,而SPE统计量反映的是残差空间的变化。关于T2和SPE这两个统计量的具体描述以及相应控制限的设定可以参考文献[22],两个统计量中只要有任意一个超过其对应控制限,即可认定有故障发生。
1.2 海林格距离HD作为一种度量两个概率密度分布差异的工具,已得到广泛应用[23-25]。假设有两个连续的概率密度函数f(x)和g(x),那么f(x)和g(x)之间的海林格距离可以由式(8)描述。
$ {D_{{\rm{HD}}}}\left( {f, g} \right) = \sqrt {\frac{1}{2}\int {{{\left( {\sqrt {f\left( x \right)} - \sqrt {g\left( x \right)} } \right)}^2}{\rm{d}}x} } $ | (8) |
f(x)和g(x)的差异越大,HD的数值就越大。因此HD能够用来衡量正常指标与异常指标之间的差异。同时,海林格距离是一个对称有界的距离,即0≤DHD(f, g)=DHD(g, f)≤1,根据勒贝格测度[26]可以得到式(8)的平方变形形式
$ D_{{\rm{HD}}}^{^2}\left( {f, g} \right) = 1 - \int {\sqrt {f\left( x \right)g\left( x \right)} {\rm{d}}x} $ | (9) |
对于任意样本xi(i=1, 2, …, n),在样本数据集X中以欧式距离为度量找寻xi的k个近邻点组成局部近邻集N(xi)={xi1, …xif, …xik},f=1, 2, …, k,并通过式(10)计算样本xi和它的局部近邻集成员xif的马氏距离
$ \begin{array}{l} \;\;\;\;\;\;\;{d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, x_{_i}^{^f}) = \\ \sqrt {\{ {\mathit{\boldsymbol{x}}_i} - {\bf{mean}}[N(x_{_i}^{^f})]\} \mathit{\boldsymbol{ \boldsymbol{\varSigma} }}{^{ - 1}}{{\{ {\mathit{\boldsymbol{x}}_i} - {\bf{mean}}[N(x_{_i}^{^f})]\} }^{\rm{T}}}} \end{array} $ | (10) |
式中,Σ为xif的局部近邻集N(xif)的协方差矩阵,mean [N(xif)]为其均值向量。式(10)中利用mean [N(xif)]替代xif是为了在正常工况下减少关键主元可能受到的污染的影响[27]。接着对每个样本的近邻按照式(10)进行排序并得到每个样本的领域半径k_distancem(xi)。
$ \begin{array}{l} {d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, x_{_i}^1) \le \ldots \le {d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, x_{_i}^{^f}) \ldots \le {d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, x_{_i}^k)\\ k\_{\rm{distanc}}{{\rm{e}}_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}) = {d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, x_{_i}^k) \end{array} $ | (11) |
样本xi与其近邻点xif之间的可达距离表示为
$ \begin{array}{l} \;\;\;\;\;\;\;{\rm{reach}}\_d({\mathit{\boldsymbol{x}}_i}, x_{_i}^{^f}) = {\rm{max}}\{ k\_{\rm{distanc}}{{\rm{e}}_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}), {d_{\rm{m}}}({\mathit{\boldsymbol{x}}_i}, \\ x_{_i}^{^f})\} \end{array} $ | (12) |
同时,定义样本xi的局部可达密度为
$ {D_{{\rm{Ird}}}}({\mathit{\boldsymbol{x}}_i}) = \frac{k}{{\sum\limits_{f = 1}^k {{\rm{reach}}\_d({\mathit{\boldsymbol{x}}_i}, x_{_i}^{^f})} }} $ | (13) |
样本xi的局部离群因子表示为xi所有近邻的平均局部可达密度与样本点xi的局部可达密度的比值
$ {R_{{\rm{LOF}}}}({\mathit{\boldsymbol{x}}_i}) = \frac{1}{k}\sum\limits_{f = 1}^k {\frac{{{D_{{\rm{Ird}}}}(x_{_i}^{^f})}}{{{D_{{\rm{Ird}}}}({\mathit{\boldsymbol{x}}_i})}}} $ | (14) |
X ∈ Rn×m经过PCA分解后得到得分矩阵T =[t1, t2, …, tm]∈ Rn×m,传统PCA算法根据正常工况下的样本建立相应的模型,如式(15)所示,主元可由所有变量线性表示
$ {\mathit{\boldsymbol{t}}_j} = {\mathit{p}_{j1}}{\mathit{\boldsymbol{x}}_1} + {p_{j2}}{\mathit{\boldsymbol{x}}_2} + \ldots + {p_{jm}}{\mathit{\boldsymbol{x}}_m} $ | (15) |
由式(15)可知,负载系数pji反映了主元tj与变量xi的相关性,因此可以定义相关性指标pji2,该指标值越大,说明tj与xi的相关性越大。若pji2在[p1i2, p2i2, …, pmi2]中最大,那么主元tj就被选为关键主元。对于每一个变量,都可以通过上述方法判断获取其对应的关键主元。统计量T2的表达式为
$ {T^2} = {\mathit{\boldsymbol{x}}^{\rm{T}}}\mathit{\boldsymbol{\bar P}}{\mathit{\boldsymbol{ \boldsymbol{\varLambda} }}^{ - 1}}{\mathit{\boldsymbol{P}}^{\rm{T}}}\mathit{\boldsymbol{x}} $ | (16) |
式中,P =[p1, p 2, …, pf]∈ Rm×f为所选关键主元对应的负载向量构成的负载矩阵,Λ =diag[λ1, λ2, …, λf]∈ Rf×f为关键主元对应的特征值构成的对角矩阵,f为关键主元的个数。相应的控制限参照PCA算法用于故障检测时T2的控制限
$ T_\alpha ^2 = \frac{{f({n^2} - 1)}}{{n\left( {n - f} \right)}}{F_{f, n - f;\alpha }} $ | (17) |
式中, n为样本个数,Ff, n-f; α为置信水平1-α下、自由度f和n-f的F分布临界值。关键主元的具体描述可以参考文献[14]。
一般情况下,当故障发生时,不同得分向量与故障之间的相关性是存在差异的。得分向量较正常工况变化幅度越大,说明其包含越多的信息量[12],与故障的发生也越紧密相关。因此,须根据得分向量与故障的相关性给予其不同的权重值。与故障相关性越大的得分向量,对后续故障检测的贡献度也越大,需赋予较大的权重。本文利用基于海林格距离的得分向量变化率对权重进行定义,并且给出了该指标对于故障敏感性的证明。从故障对得分向量产生的影响角度出发,文献[28]对加性故障和乘性故障有如下定义:加性故障指故障的发生只影响得分向量的均值,乘性故障指故障的发生只影响得分向量的方差。由文献[28]可知,传统T2统计量对于乘性故障的检测效果较差,这是由于T2统计量本身的定义是从加性故障的角度出发的。接下来,给出基于海林格距离变化率的统计量。
假设正常工况下的得分向量为tj, j=1, 2, …, m,故障情况下的得分向量为
$ hd_j^{^2} = 1 - \int {\sqrt {f({\mathit{\boldsymbol{t}}_j})f({{\mathit{\boldsymbol{\tilde t}}}_j})} {\rm{d}}t} $ | (18) |
式中,f(tj)和
$ \begin{array}{l} f\left( t \right) = \frac{1}{{nh\sqrt {2{\rm{ \mathit{ π} }}} }}\sum\limits_{i = 1}^n {{\rm{exp}} - \frac{{{{({\mathit{\boldsymbol{t}}_j} - {t_{ij}})}^2}}}{{2{h^2}}}} \\ {\rm{ }}f\left( {\tilde t} \right) = \frac{1}{{nh\sqrt {2{\rm{ \mathit{ π} }}} }}\sum\limits_{i = 1}^n {{\rm{exp}} - \frac{{{{({{\mathit{\boldsymbol{\tilde t}}}_j} - {{\tilde t}_{ij}})}^2}}}{{2{h^2}}}} \end{array} $ | (19) |
式中,n为样本数目,h为平滑参数,tij为得分向量tj的第i个元素,
若
$ hd_j^{^2} = 1 - \left( {\frac{{2\sqrt {{\lambda _j}{{\tilde \lambda }_j}} }}{{{\lambda _j} + {{\tilde \lambda }_j}}}} \right){\rm{exp}}\left( { - \frac{{{{({{\tilde \mu }_j} - {\mu _j})}^2}}}{{4({\lambda _j} + {{\tilde \lambda }_j})}}} \right) $ | (20) |
文献[17]证明了当故障引起得分向量的均值和方差发生变化后,hdj2与均值和方差的变化量正相关,即hdj2对故障的发生十分敏感。参考文献[29]中的表示形式,海林格距离变化率可以表示成单个得分向量与所有得分向量平均值的海林格距离二次型与该统计量的平均值之比
$ Rhd_j^{^2} = hd_j^{^2}/\overline {hd_j^{^2}} $ | (21) |
式中,hdj2为第j个得分向量的海林格距离的二次型统计量,
假设故障发生时导致得分向量均值的变化为Δμj,方差变化为Δλj,当传感器发生加性故障,即故障的发生只改变了得分向量的均值时,有
$ \begin{array}{l} \;\;\;\;\;\;\;Rhd_j^{^2} = \frac{{hd_j^{^2}}}{{\overline {hd_j^{^2}} }} = \frac{1}{c} \times \left( {1 - {{\left( {\frac{{2\sqrt {{\lambda _j}{{\tilde \lambda }_j}} }}{{{\lambda _j} + {{\tilde \lambda }_j}}}} \right)}^{\frac{1}{2}}} \cdot } \right.\\ \left. {{\rm{exp}}\left( { - \frac{{{{({{\tilde \mu }_j} - {\mu _j})}^2}}}{{4({\lambda _j} + {{\tilde \lambda }_j})}}} \right)} \right) = \frac{1}{c} \times \left( {1 - {\rm{exp}}\left( { - \frac{{\Delta \mu _{_j}^{^2}}}{{8{\lambda _j}}}} \right)} \right) \end{array} $ | (22) |
将式(22)中的Rhdj2对Δμj求导得
$ \frac{{\partial Rhd_j^{^2}}}{{\partial \Delta {\mu _j}}} = \frac{1}{{4c{\lambda _j}}} \times {e^{\frac{{\Delta \mu _{_j}^{^2}}}{{8\lambda }}}} \times \Delta {\mu _j} $ | (23) |
式中,当Δμj>0时,
当传感器发生乘性故障,即故障的发生只改变得分向量的方差时,有
$ Rhd_j^{^2} = \frac{{hd_j^{^2}}}{{\overline {hd_j^{^2}} }} = \frac{1}{c} \times \left( {1 - {{\left( {\frac{{2\sqrt {{\lambda _j}({\lambda _j} + \Delta {\lambda _j})} }}{{2{\lambda _j} + \Delta {\lambda _j}}}} \right)}^{\frac{1}{2}}}} \right) $ | (24) |
将式(24)中的Rhdj2对Δλj求导得
$ \begin{array}{l} \;\;\;\;\;\;\;\frac{{\partial Rhd_j^{^2}}}{{\partial \Delta {\lambda _j}}} = - \frac{1}{c} \times \\ \frac{{{\lambda _j}{{(\lambda _j^{^2} + {\lambda _j}\Delta {\lambda _j})}^{ - \frac{1}{2}}}(2{\lambda _j} + \Delta {\lambda _j}) - 2{{(\lambda _j^{^2} + \Delta {\lambda _j}{\lambda _j})}^{\frac{1}{2}}}}}{{{{(2{\lambda _j} + \Delta {\lambda _j})}^2}}} \end{array} $ | (25) |
式中,当Δλj>0时,
当传感器上加性故障与乘性故障并存,即故障的发生既改变了得分向量的均值,又改变了得分向量的方差时,有
$ \begin{array}{l} \;\;\;\;\;\;\;Rhd_j^{^2} = \frac{{hd_j^{^2}}}{{\overline {hd_j^{^2}} }} = \frac{1}{c} \times \left( {1 - \left( {\frac{{2\sqrt {{\lambda _j}({\lambda _j} + \Delta {\lambda _j})} }}{{2{\lambda _j} + \Delta {\lambda _j}}}} \right)} \right)\cdot\\ {\rm{exp}}\left( { - \frac{{\Delta \mu _j^2}}{{4(2{\lambda _j} + \Delta {\lambda _j})}}} \right) \end{array} $ | (26) |
将式(26)分别对Δλj和Δμj求偏导,由上述两种情况可知,Rhdj2随着Δλj和Δμj的增大而增大。综合以上3种情况的证明可知,基于海林格距离的变化率对于故障的发生十分敏感。另一方面,噪声对于系统的影响也需要考虑。
假设λj=λj*+ν,其中λj*表示无故障无噪声情况下的第j个方差,ν为噪声,对此有
$ \begin{array}{l} \;\;\;\;\;\;\;Rhd_j^{^2} = \frac{{hd_j^{^2}}}{{\overline {hd_j^{^2}} }} = \frac{1}{c} \times \left( {1 - \left( {\frac{{2\sqrt {(\lambda _j^{^*} + \nu ){{\tilde \lambda }_j}} }}{{\lambda _j^{^*} + \nu + {{\tilde \lambda }_j}}}} \right)} \right)\cdot\\ {\rm{exp}}\left( { - \frac{{{{({{\tilde \mu }_j} - {\mu _j})}^2}}}{{4(\lambda _j^{^*} + \nu + {{\tilde \lambda }_j})}}} \right) \end{array} $ | (27) |
对式(27)关于ν求偏导可得其sgn函数为
$ \begin{array}{l} \;\;\;\;\;\;\;{\rm{sgn}}\left( {\frac{{\partial Rhd_j^{^2}\left( \nu \right)}}{{\partial \nu }}} \right) = {\rm{sgn}}(\tilde \lambda _j^2 - {(\lambda _j^{^*})^2} + \\ {({{\tilde \mu }_j} - {\mu _j})^2}{\lambda _j}2\lambda _j^{^*}\nu - {\nu ^2}) \end{array} $ | (28) |
当ν=0时,式(28)的最大值为0,即
$ \left\{ {\begin{array}{*{20}{c}} {\frac{{\partial Rhd_j^{^2}\left( \nu \right)}}{{\partial \nu }}<0, \nu \ne 0}\\ {\frac{{\partial Rhd_j^{^2}\left( \nu \right)}}{{\partial \nu }} = 0, \nu = 0} \end{array}} \right. $ | (29) |
因此,Rhdj2随着噪声ν的增大而减小,即Rhdj2对噪声具有一定的鲁棒性。
综上可知采用Rhdj2作为统计量对于故障的检测是有效的,该统计量反映了故障工况的偏离程度,Rhdj2越大,说明第j个主元与该故障发生的相关性越大,因此赋予的权重值也越大。令
$ \alpha \prime = {\rm{exp}}\left( {\frac{{Rhd_j^{^2} - 1}}{\sigma }} \right) $ | (30) |
式中σ>0是可调参数。定义权重yjnew如式(31)所示。
$ y_j^{{\rm{new}}} = \left\{ {\begin{array}{*{20}{c}} {1, }&{Rhd_j^{^2} \le \gamma }\\ {\alpha , }&{Rhd_j^{^2} > \gamma } \end{array}} \right. $ | (31) |
式中,γ为阈值,本文通过3σ法则来确定γ的数值。假设Rhdj2的数值服从均值为M、标准差为η的高斯分布,那么阈值γ可由式(32)得到。
$ \gamma = M + L\eta $ | (32) |
式中,L为预警宽度,一般取值为3,即3σ法则。
那么,新的得分矩阵可表示为
$ \begin{array}{l} \;\;\;\;\;\;\;{\mathit{\boldsymbol{T}}_w} = {\mathit{\boldsymbol{T}}_{{\rm{key(new)}}}}\mathit{\boldsymbol{W}}{\rm{ }} = [{\rm{ }}{\mathit{\boldsymbol{t}}_{{\rm{1, new}}}}, {\rm{ }}{\mathit{\boldsymbol{t}}_{{\rm{2, new}}}}, \ldots , {\rm{ }}{\mathit{\boldsymbol{t}}_{f, {\rm{new}}}}]{\rm{ }}\cdot\\ \left[ {\begin{array}{*{20}{c}} {y_1^{{\rm{new}}}}& \ldots &0\\ \vdots & \ddots & \vdots \\ 0& \ldots &{y_f^{{\rm{new}}}} \end{array}} \right] = [y_1^{{\rm{new}}}{\mathit{\boldsymbol{t}}_{{\rm{1, new}}}}, y_2^{{\rm{new}}}{\mathit{\boldsymbol{t}}_{{\rm{2, new}}}}, \ldots , y_f^{{\rm{new}}}{\mathit{\boldsymbol{t}}_{f, {\rm{new}}}}] \end{array} $ | (33) |
式中,Tkey(new)为故障工况下关键主元构成的得分矩阵,W为加权矩阵。
传统PCA在进行故障检测时,会设定如式(6)、(7)所示的统计量进行监测,这类根据数据间距离所设定的统计量要求采样数据满足正态分布,事实上在实际工业生产过程中,大部分采样数据没有特定的分布规律,这就导致了PCA用于故障检测时效果不佳。为此,本文利用基于密度的LOF构造了一个单一统计量,相较于T2和SPE,该统计量集中了故障对过程变量的影响。同时,LOF从密度的角度出发,依靠数据点的离散程度对故障进行检测,对于数据的分布没有特定的要求,避免了传统T2和SPE统计量要求数据服从正态分布的不足。除此之外,基于马氏距离的LOF与原始LOF算法相比,考虑了加权后的关键主元与其邻域子集之间的马氏距离对过程变量的影响,最终形成一种对数据分布具有鲁棒性的统计量。由于LOF统计量的分布情况无法准确获取,因此本文采用核密度估计法确定所构造LOF统计量的控制限。令正常工况下获得的LOF统计量构成集合Ω={RLOF, x1, RLOF, x2, …, RLOF, xn},对于LOF统计量进行核密度估计,如式(34)所示。
$ \hat f({R_{{\rm{LOF}},x}}) = \frac{1}{{n\theta }}\sum\limits_{i = 1}^n {K\left( {\frac{{{R_{{\rm{LOF}},x}} - {R_{{\rm{LOF}},{x_i}}}}}{\theta }} \right)} $ | (34) |
式中,K(·)为核函数,θ为核宽,LOF控制限RLOF,limit在置信水平为α的情况下可由式(35)获得
$ \int_{ - \infty }^{{R_{{\rm{LOF, limit}}}}} {\hat f({R_{{\rm{LOF, }}x}}){\rm{d}}{R_{{\rm{LOF, }}x}} = 1 - \alpha } $ | (35) |
基于HDWFV E- MDLOF的故障检测流程如图 1所示。
离线建模阶段步骤如下。
1) 采集正常工况下的样本数据,标准化得到X ∈ R n×m。
2) 利用FVE得到f个关键主元tj(j=1, 2, …, f)以及对应的负载向量
3) 将Tkey=[t1, t2, …, tf]∈ Rn×f作为改进LOF算法的输入,并利用核密度估计确定其控制限RLOF,limit。
在线检测阶段步骤如下。
1) 采集异常工况下的样本数据,标准化得到Xnew∈ Rn×m。
2) 对于新的数据xnew∈ Rm×1,关键主元由
3) 通过式(20)、(21)计算Rhdj2统计量并利用3σ法则计算其控制限γ,再根据式(30)~(32)赋予得分向量相应权重,根据式(33)形成新的加权后的得分矩阵Tw。
4) 将
文献[30]中的数值实例被广泛应用于故障检测的仿真实验中,本文采用此数值实例验证所提方法的有效性。该数值例子表示结构如式(36)所示。
$ \begin{array}{l} \mathit{\boldsymbol{r}}\left( i \right) = \mathit{\boldsymbol{A}} \times \mathit{\boldsymbol{r}}\left( {i - 1} \right) + \mathit{\boldsymbol{B}} \times \mathit{\boldsymbol{u}}\left( {i - 1} \right)\\ \mathit{\boldsymbol{u}}\left( i \right) = \mathit{\boldsymbol{C}} \times \mathit{\boldsymbol{u}}\left( {i - 1} \right) + \mathit{\boldsymbol{D}} \times \mathit{\boldsymbol{h}}\left( {i - 1} \right)\\ \mathit{\boldsymbol{g}}\left( i \right) = \mathit{\boldsymbol{r}}\left( i \right) + \mathit{\boldsymbol{v}}\left( i \right) \end{array} $ | (36) |
式中,
1) 故障1 变量h1从第51个样本点开始直到200个样本点结束,增加一个幅值为3的单位阶跃故障。
2) 故障2 变量h2从第51个样本点开始直到200个样本点结束,增加一个0.06(i-50)的斜坡故障。
在运用FVE方法进行主元选取时,特征空间包含了几乎所有原始变量的信息,残差空间中几乎不包含有用信息,因此只需构建反映特征空间的T2统计量进行监测。运用本文所提方法与CPV- T2、CPV-SPE、FVE-T2、FVE-LOF以及HDWFVE-LOF进行仿真对比实验。其中CPV的贡献度设定为85%,控制限采用95%的置信度;LOF中的k值设定为15, 核宽设为500m(m为变量个数)。在CPV主元选取方法中,前3个主元的累计方差贡献率超过了85%,因此按照方差从大到小的顺序选取PC1、PC2、PC3为主元,而在FVE的主元选取方法中,各变量对应的关键主元如表 1所示,PC2、PC3、PC4、PC5被选为主元。表 2为各个方法对于数值实例中故障1和故障2的漏报率与误报率。各个方法对故障1的检测结果如图 2所示。图 2(a)、(b)为传统PCA算法利用CPV主元选取方法所构建的基于T2和SPE统计量的故障检测结果,结合表 2可知,其中T2统计量的漏报率为74%,检测效果不佳,SPE统计量的漏报率达到75%,表明该统计量基本无法检测到故障的发生。图 2(c)为利用FVE主元选取方法进行故障检测的结果,结合表 2可知,T2统计量的漏报率降低为48.7%。图 2(d)为FVE主元选取法利用LOF作为统计量的故障检测结果,由表 2知其漏报率为46%,漏报率的降低是因为该方法从数据密度大小出发来搜寻故障点。图 2(e)给出了HDWFVE-LOF的故障检测结果,得益于对故障相关主元的合理加权,由表 2可知其漏报率为28%,得到大幅降低。图 2(f)为本文所提方法的故障检测结果,可以看出基于马氏距离的LOF算法起到了很好的效果,相比于其他方法,本文所提方法的漏报率最低,为20.8%。
图 3给出了不同方法对故障2的检测结果。结合表 2的结果,总体上,除了传统PCA利用CPV的主元选取法将SPE作为统计量的漏报率较高外,其余方法均能够保持较低的故障漏报率。其中,本文所提方法最早检测到故障的发生,并且在检测到故障发生后依然保持着很好的稳定性,统计量曲线始终位于控制限上方,而其他方法在检测到故障发生后,统计量曲线有回落到控制限的现象(图 3(a)、(b)、(c)、(d)),引起漏报。
为了进一步体现LOF作为统计量的优越性,图 4(a)、(b)给出了故障2中运用本文方法加权后关键主元PC3和PC5的正态概率分布,其中横坐标为主成分样本点数据,纵坐标为先验概率。数据的分布越接近标准正态分布,相应图上散点的分布就越近似直线。由图 4可知,图中条形点的头部和尾部较直线还是有着较大的偏移,意味着这两个加权后的主元并不服从正态分布,这也从另一个角度说明了利用LOF构建统计量的必要性。综上,数值仿真结果体现了本文所提方法的有效性与优越性。
带钢热连轧过程(hot strip mill process, HSMP)是工业生产中的一个重要工序,其生产流程如图 5所示。由于HSMP在运行过程中有高温度、高速度、多阶段的特征,导致其变量具有高耦合的特点。对此,本文将该过程用于故障检测的研究。在带钢热连轧现场(鞍钢集团1 700 mm带钢热连轧生产线)收集能够反映生产过程的数据,相关的20个过程变量的具体描述如表 3所示。
首先选取4 000个正常工况下带钢热连轧过程样本数据进行离线建模,再收集4 000个带有故障的样本数据进行在线检测,其中故障产生时间为样本点2 001到3 000,故障原因为第5机架的弯辊力测量传感器故障。LOF算法中近邻数k设置为150。利用KDE进行控制限计算时,核宽θ设置为500m(m为变量数)。利用FVE得到的关键主元与变量的对应关系如表 4所示。各方法对于该故障的检测结果如图 6所示,具体结果列于表 5。图 6(a)、(b)为PCA利用传统CPV方法对于该故障的检测结果,T2和SPE统计量的漏报率分别为74.2%和90.2%,数值都较高,尤其是SPE统计量,基本无法检测到故障的发生。图 6(c)为FVE方法选取关键主元后构建T2统计量的故障检测结果,关键主元的选取使得故障漏报率大大降低,且故障误报率没有出现较大的增加。对比图 6(d)、(e)、(f)可以得出,本文所提方法在检测出所有故障的同时,还获得了最低的故障误报率。
表 6给出了Relief F- PCA算法[11]、敏感主成分分析(SPCA)算法[12]、故障相关- 贝叶斯推断主成分分析(FBPCA)算法[31]以及敏感主元多块主成分分析(MBSPCA)算法[32]对于第5机架的弯辊力测量传感器故障的检测漏报率和误报率。其中MBSPCA算法中ω取值0.2,即敏感主元阈值εlimit为0.003 9,所有方法的置信度均为95%。由表 6的数据对比可发现,本文所提方法的漏报率与误报率均为最低。综上可说明本文所提HDWFV E- MDLOF算法的有效性与优越性。
本文提出一种基于HDWFV E- MDLOF的故障检测算法,在PCA框架下的主元选取阶段利用FVE方法获取关键主元,保留了全部变量信息,并利用海林格距离变化率对关键主元中的故障相关主元进行加权突出,有效地降低了故障漏报率;利用改进的LOF构造统计量,突破了传统统计量对于数据分布的限定。数值实例及带钢热连轧实际生产数据结果表明,与Relief F- PCA、SPCA、FBPCA以及MBSPCA等算法相比,本文所提算法的漏报率及误报率均为最低,证明了所提方法的有效性与优越性。
[1] |
CHEN H T, JIANG B, DING S X, et al. Data-driven fault diagnosis for traction systems in high-speed trains: a survey, challenges, and perspectives[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(3): 1700-1716. DOI:10.1109/TITS.2020.3029946 |
[2] |
YIN S, DING S X, XIE X C, et al. A review on basic data-driven approaches for industrial process monitoring[J]. IEEE Transactions on Industrial Electronics, 2014, 61(11): 6418-6428. DOI:10.1109/TIE.2014.2301773 |
[3] |
QU L, LI L, ZHANG Y, et al. PPCA-based missing data imputation for traffic flow volume: a systematical approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2009, 10(3): 512-522. DOI:10.1109/TITS.2009.2026312 |
[4] |
LUO K W, LI S L, DENG R, et al. Multivariate statistical kernel PCA for nonlinear process fault diagnosis in military barracks[J]. International Journal of Hybrid Information Technology, 2016, 9(1): 195-206. DOI:10.14257/ijhit.2016.9.1.17 |
[5] |
KU W F, STORER R H, GEORGAKIS C. Disturbance detection and isolation by dynamic principal component analysis[J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30(1): 179-196. DOI:10.1016/0169-7439(95)00076-3 |
[6] |
MALINOWSKI E R. Factor analysis in chemistry[M]. 2nd ed. New York: Wiley & Sons. Inc., 1991.
|
[7] |
VALLE S, LI W H, QIN S J. Selection of the number of principal components: the variance of the reconstruction error criterion with a comparison to other methods[J]. Industrial & Engineering Chemistry Research, 1999, 38(11): 4389-4401. |
[8] |
KAISER H F. The application of electronic computers to factor analysis[J]. Educational and Psychological Measurement, 1960, 20(1): 141-151. DOI:10.1177/001316446002000116 |
[9] |
JOLLIFFE I T. A note on the use of principal components in regression[J]. Applied Statistics, 1982, 31(3): 300-303. DOI:10.2307/2348005 |
[10] |
TOGKALIDOU T, BRAATZ R D, JOHNSON B K, et al. Experimental design and inferential modeling in pharmaceutical crystallization[J]. AIChE Journal, 2001, 47(1): 160-168. DOI:10.1002/aic.690470115 |
[11] |
陶阳, 王帆, 侍洪波, 等. 基于ReliefF的主元挑选算法在过程监控中的应用[J]. 化工学报, 2017, 68(4): 1525-1532. TAO Y, WANG F, SHI H B, et al. Principal component selection algorithm based on ReliefF and its application in process monitoring[J]. CIESC Journal, 2017, 68(4): 1525-1532. (in Chinese) |
[12] |
JIANG Q C, YAN X F, ZHAO W X. Fault detection and diagnosis in chemical processes using sensitive principal component analysis[J]. Industrial & Engineering Chemistry Research, 2013, 52(4): 1635-1644. |
[13] |
仓文涛, 杨慧中. 基于主元子空间富信息重构的过程监测方法[J]. 化工学报, 2018, 69(3): 1114-1120. CANG W T, YANG H Z. A process monitoring method based on informative principal component subspace reconstruction[J]. CIESC Journal, 2018, 69(3): 1114-1120. (in Chinese) |
[14] |
SONG B, MA Y Y, SHI H B. Improved performance of process monitoring based on selection of key principal components[J]. Chinese Journal of Chemical Engineering, 2015, 23(12): 1951-1957. DOI:10.1016/j.cjche.2015.11.014 |
[15] |
JIANG Q C, WANG B, YAN X F. Multiblock independent component analysis integrated with Hellinger distance and Bayesian inference for non-Gaussian plant-wide process monitoring[J]. Industrial & Engineering Chemistry Research, 2015, 54(9): 2497-2508. |
[16] |
HARROU F, MADAKYARU M, SUN Y. Improved nonlinear fault detection strategy based on the Hellinger distance metric: plug flow reactor monitoring[J]. Energy and Buildings, 2017, 143: 149-161. DOI:10.1016/j.enbuild.2017.03.033 |
[17] |
CHEN H T, JIANG B, LU N Y. A newly robust fault detection and diagnosis method for high-speed trains[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2198-2208. DOI:10.1109/TITS.2018.2865410 |
[18] |
BREUNIG M M, KRIEGEL H P, NG R T, et al. LOF: identifying density-based local outliers[C]//ACM Sigmod International Conference on Management of Data. Dallas, 2000: 93-104.
|
[19] |
LEE J, KANG B, KANG S H. Integrating independent component analysis and local outlier factor for plant-wide process monitoring[J]. Journal of Process Control, 2011, 21(7): 1011-1021. DOI:10.1016/j.jprocont.2011.06.004 |
[20] |
DENG X G, WANG L. Modified kernel principal component analysis using double-weighted local outlier factor and its application to nonlinear process monitoring[J]. ISA Transactions, 2018, 72: 218-228. DOI:10.1016/j.isatra.2017.09.015 |
[21] |
冯立伟, 李元, 张成, 等. 基于时空近邻标准化和局部离群因子的复杂过程故障检测[J]. 控制理论与应用, 2020, 37(3): 651-657. FENG L W, LI Y, ZHANG C, et al. Time-space neighborhood standardization-local outlier factor based fault detection for complex process[J]. Control Theory and Applications, 2020, 37(3): 651-657. (in Chinese) |
[22] |
QIN S J. Statistical process monitoring: basics and beyond[J]. Journal of Chemometrics, 2003, 17: 480-502. DOI:10.1002/cem.800 |
[23] |
BASSEVILLE M. Divergence measures for statistical data processing-an annotated bibliography[J]. Signal Processing, 2013, 93(4): 621-633. DOI:10.1016/j.sigpro.2012.09.003 |
[24] |
DITZLER G, POLIKAR R. Hellinger distance based drift detection for nonstationary environments[C]//2011 IEEE Symposium on Computational Intelligence in Dynamic and Uncertain Environments (CIDUE). Paris, 2011: 41-48.
|
[25] |
LI C, HUANG B, QIAN F. Hellinger distance based probability distribution approach to performance monitoring of nonlinear control systems[J]. Chinese Journal of Chemical Engineering, 2015, 23(12): 1945-1950. DOI:10.1016/j.cjche.2015.10.005 |
[26] |
童武. 谈谈Lebesgue测度概念的建立[J]. 数学通报, 1988(3): 38-41. TONG W. On the establishment of Lebesgue's measure[J]. Bulletin des Sciences Mathematics, 1988(3): 38-41. (in Chinese) |
[27] |
MA H H, HU Y, SHI H B. A novel local neighborhood standardization strategy and its application in fault detection of multimode processe[J]. Chemometrics and Intelligent Laboratory Systems, 2012, 118(1): 287-300. |
[28] |
ZHANG K, DING S X, SHARDT Y A W, et al. Assessment of T2- and Q-statistics for detecting additive and multiplicative faults in multivariate statistical process monitoring[J]. Journal of the Franklin Institute, 2017, 354(2): 668-688. DOI:10.1016/j.jfranklin.2016.10.033 |
[29] |
韩敏, 张占奎. 基于加权核独立成分分析的故障检测方法[J]. 控制与决策, 2016, 31(2): 242-248. HAN M, ZHANG Z K. Fault detection method based on weighted kernel independent component analysis[J]. Control and Decision, 2016, 31(2): 242-248. (in Chinese) |
[30] |
LEE J M, YOO C K, LEE I B. Statistical process monitoring with independent component analysis[J]. Journal of Process Control, 2004, 14(5): 467-485. DOI:10.1016/j.jprocont.2003.09.004 |
[31] |
JIANG Q C, YAN X F, HUANG B. Performance-driven distributed PCA process monitoring based on fault-relevant variable selection and Bayesian inference[J]. IEEE Transactions on Industrial Electronics, 2016, 63(1): 377-386. DOI:10.1109/TIE.2015.2466557 |
[32] |
顾炳斌, 熊伟丽, 史旭东. 基于故障敏感主元的多块PCA故障监测方法[J]. 高校化学工程学报, 2019, 33(6): 1499-1508. GU B B, XIONG W L, SHI X D. Multi-block PCA process monitoring based on fault sensitive principal components[J]. Journal of Chemical Engineering of Chinese Universities, 2019, 33(6): 1499-1508. (in Chinese) |