CN118094371A - 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 - Google Patents
基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 Download PDFInfo
- Publication number
- CN118094371A CN118094371A CN202410100889.4A CN202410100889A CN118094371A CN 118094371 A CN118094371 A CN 118094371A CN 202410100889 A CN202410100889 A CN 202410100889A CN 118094371 A CN118094371 A CN 118094371A
- Authority
- CN
- China
- Prior art keywords
- fault diagnosis
- gru
- rolling bearing
- improved
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000005096 rolling process Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000011176 pooling Methods 0.000 claims abstract description 7
- 230000036541 health Effects 0.000 claims abstract description 4
- 210000002569 neuron Anatomy 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 16
- 235000004257 Cordia myxa Nutrition 0.000 claims description 13
- 244000157795 Cordia myxa Species 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 13
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000002679 ablation Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241000288105 Grus Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,包括以下步骤:获取滚动轴承运行过程中的原始振动数据,划分为训练数据集和测试数据集;将训练数据集输入多尺度残差网络中进行初步特征提取;将多尺度残差网络提取的局部特征信息输入到改进GRU中;最终得到的特征信息经过α‑Dropout和全局平均池化处理后,输入softmax层进行故障分类;对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型;将测试数据集输入故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。本发明通过在CNN中引入多尺度结构,有效提取滚动轴承信号的局部特征;同时对GRU进行改进,使其能够更好地捕捉序列数据中的长期依赖关系和时间相关性,提高故障诊断性能和收敛性。
Description
技术领域
本发明涉及一种滚动轴承故障诊断方法,具体涉及一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法。
背景技术
随着现代工业的迅速发展,旋转机械被广泛应用于制造业、交通运输业、航空航天业等不同领域。滚动轴承作为旋转机械的关键部件,对保证机械设备安全高效的运行起着重要作用。滚动轴承通常在复杂的工作环境中进行高强度的工作,这可能会造成轴承损坏进而引发巨大的经济损失甚至是人员伤亡。因此,对滚动轴承进行有效的故障诊断越来越受到人们的重视。
近年来,深度学习因其强大的特征挖掘能力受到了各个领域的广泛关注,也为故障诊断提供了新的视角。与传统的故障诊断方法相比,深度学习可以自适应地从振动信号中提取故障信息,避免人工处理带来的信息损失。因此,大量的深度学习模型在故障诊断领域得到了应用,其中卷积神经网络(Convolutional Neural Network,CNN)和门控循环单元(Gated Recurrent Unit,GRU)在故障诊断方面取得了显著的成果。但由于转速、负载和故障类型的不同,所获取的滚动轴承振动信号也表现出多尺度特性,而传统的CNN感受野单一,不能有效地处理多尺度特征提取问题。同时,GRU也存在训练时间长、收敛性差和梯度爆炸等问题。
发明内容
针对上述技术问题,本发明提出了一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,通过在卷积神经网络CNN中引入多尺度结构,有效提取滚动轴承信号的局部特征,并利用残差连接来加强特征表示能力。同时对门控循环单元GRU进行改进,使其能够更好地捕捉序列数据中的长期依赖关系和时间相关性,提高故障诊断性能和收敛性。
本发明采取的技术方案为:
基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,包括以下步骤:
步骤1:获取滚动轴承运行过程中的原始振动数据;
步骤2:将步骤1获取的原始振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
步骤3:将训练数据集输入多尺度残差网络中进行初步特征提取;
步骤4:将多尺度残差网络提取的局部特征信息输入到改进GRU中,进一步获取时序特征;
步骤5:最终得到的特征信息经过α-Dropout和全局平均池化(Global AveragePooling,GAP)处理后,输入softmax层进行故障分类;
步骤6:重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型;
步骤7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
所述步骤3中,多尺度残差网络由多个基本残差块级联构成,基本残差块将输入信号按照层次结构进行拆分,并在各分支上进行独立的卷积操作,之后再将卷积输出进行通道级的信息融合,从而得到不同尺度的特征信息;
多尺度残差网络中进行初步特征提取,包括以下步骤:
S3.1:基本残差块中,给定一个输入信号X,首先,通过一个32×32卷积得到基本特征映射x,宽卷积核可以提供更大的感受野以更好的获取全局信息;
S3.2:随后,将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,i∈{1,2,...,n};与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,通道数为1/n。
S3.3:之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示。此外,每个xi在输入Ci()之前将先与yi-1进行叠加。因此,yi表示为:
S3.4:此外,为了更好地融合特征信息,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y。
S3.5:然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys。S3.6:最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
所述S3.6中,批归一化BN是一种用于加速神经网络训练过程并提高模型性能的技术。它通过对每个小批量的输入进行归一化操作,将其均值调整为0,方差调整为1,以使数据分布更稳定。具体来说,对于输入x,它的均值为μ,标准差为σ,经过批归一化之后得到输出 的计算公式为:
其中,γ和β分别是缩放因子和平移因子,ε是一个极小的常数,以避免分母为0的情况。
进一步地,整流线性单元ReLU是一种常用的激活函数,它将负输入值映射为零,而将非负输入值保持不变,ReLU函数的定义如下:
ReLU(x)=max(0,x)
其中,x是输入值。
步骤3中,优选地,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n可能允许学习具有更丰富感受野大小的特征。因为当1<j≤i时,Ci()可以接受来自所有特征映射子集xj的特性信息。为了简化结构和减少计算,本发明将n设置为4。
所述步骤4中,改进GRU重新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并将自归一化指数线性单元(Self-NormalizingExponential Linear Unit,SELU)作为GRU新的激活函数,从而提升网络在训练过程中的自归一化属性。
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733。
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出;ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
所述步骤5包括以下步骤:
S5.1:通过α-Dropout对改进GRU的输出进行正则化处理,降低模型的复杂度并提高其泛化能力;
S5.2:利用GAP对S5.1正则化处理后的特征进行降维操作,以便将高维的特征向量降维成分类器所需的一维向量;
S5.3:将最终得到的特征向量输入softmax层进行故障分类。
S5.1中,在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率。具体来说,假设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中:p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
S5.2中,GAP与传统的池化层不同,它计算每个通道的平均值作为通道输出。这样,GAP就能将特征图的空间维度缩减为单一维度,GAP的计算可通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
S5.3中,将最终得到的特征向量输入softmax层进行故障分类。softmax是一种常用的激活函数,主要用于多分类问题中对样本类别的预测,具体来说,当输入向量Z的维度为n时,第i个维度的分布概率Pi可以写成:
其中,Zi和Zj分别表示输入向量Z的第i和j个维度。
步骤6中,多尺度残差网络、改进GRU和后续的优化及分类网络构成故障诊断模型,重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型。
本发明一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,技术效果如下:1)本发明采用层次结构和通道级的信息融合构建多尺度网络,使其在对不同尺度的特征进行深度挖掘的同时,能够有效减少模型参数,提升网络运行效率,并使用残差连接加强特征表征能力,解决深度神经网络训练过程中出现的梯度消失和梯度爆炸问题。
2)本发明新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并在激活函数中引入SELU,提升网络在训练过程中的自归一化属性,促进信号在训练中靠拢零均值和单位方差,增强对非相关性信号的抗干扰性能。
3)本发明并将SELU作为新的激活函数,引入自归一化属性构建了改进GRU,以便更有效地捕获时间特征。
4)本发明中多尺度残差网络能够对不同尺度的特征进行深度挖掘,并且采用层次结构和通道级的信息融合,有效减少模型参数,提升网络运行效率。
附图说明
图1为本发明所提出的一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法流程图。
图2为本发明所涉及的信号分割和数据集划分示意图。
图3为本发明所提出的多尺度残差网络的基本残差块结构图。
图4为本发明所提出的改进GRU结构图。
图5为本发明优选实施例原始数据可视化分布图。
图6为本发明优选实施例提取的特征可视化分布图。
图7为本发明优选实施例的诊断结果混淆矩阵图。
具体实施方式
为了更加清晰完整的阐述本发明的技术方案,以下结合附图与实施例,对本发明作进一步详细说明。
基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其流程图如图1所示,主要包括以下步骤:
S1:通过数据采集系统,获取滚动轴承运行过程中的原始振动数据;
数据采集系统主要由电机、传动机构、电机驱动器、振动传感器、数据采集板、电脑及其配套软件组成,用于获取滚动轴承在运行过程中的产生的振动信号。
S2:将采集到的振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
数据采集系统采集的振动信号是单一维度的时序信号,在进行故障诊断前,需要分割成特定长度和数量的样本信号,具体的分割方式如图2所示,对于一个总长度为L的信号,假设分割长度为l,则可以得到数量为n=L/l的样本,然后在这个基础上将样本划分为训练数据集和测试数据集。
S3:将训练数据集输入多尺度残差网络中进行初步的特征提取;
不同故障类型的轴承其振动信号虽然具有不同的特点,但未经处理并不易区分,多尺度残差网络从不同尺度进行深入挖掘,可以获取细致的局部特征信息。
S4:将多尺度残差网络提取的局部特征信息,输入改进GRU进一步获取时序特征;
通过多尺度残差网络提取后的特征信息主要是振动信号的局部特征信息,振动信号体现为一组时间序列,利用改进GRU进行时序特征提取能够使得不同状态的滚动轴承振动信号特征区分度更高。
S5:最终得到的特征信息经过α-Dropout和GAP处理后,输入softmax层进行故障分类;
经过多尺度残差网络和改进GRU提取的特征信息具有高度的区分度,使用α-Dropout和GAP进行优化后得到一组一维的特征数据,它们来自不同故障状态的滚动轴承,softmax常用于多分类问题,能够将不同的故障状态数据进行区分,实现故障分类。
S6:重复S3-S5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型;
S7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
进一步地,所述S3中,多尺度残差网络由多个基本残差块级联构成,基本残差块结构图如图3所示,具体来说,给定一个输入信号X,首先通过一个32×32卷积得到基本特征映射x,宽卷积核可以提供更大的感受野以更好的获取全局信息。随后将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,这里i∈{1,2,...,n}。与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,但通道数为1/n。之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示。此外,每个xi在输入Ci()之前将先与yi-1进行叠加。因此,yi可以表示为:
此外,为了更好地融合特征信息,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y。然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys。最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
优选地,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n可能允许学习具有更丰富感受野大小的特征。因为当1<j≤i时,Ci()可以接受来自所有特征映射子集xj的特性信息。为了简化结构和减少计算,本发明将n设置为4。
进一步地,所述S4中,改进GRU的结构图如图4所示,它重新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并将SELU作为GRU新的激活函数,从而提升网络在训练过程中的自归一化属性,促进信号在训练中靠拢零均值和单位方差,增强对非相关性信号的抗干扰性能。
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733。
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出,ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
优选地,传统GRU中使用的激活函数tanh在输入超过特定范围时,其导数会趋于零。也就是说,网络很难通过梯度下降来更新权值,甚至会造成梯度消失,降低网络的稳定性。tanh和SELU的函数曲线如图。因此,改进GRU使用SELU作为激活函数不仅可以将自归一化特性融入网络中,还可以避免梯度消失,提高网络的鲁棒性和收敛性。
进一步地,所述S5可以细分为如下三个步骤:
s51:通过α-Dropout对改进GRU的输出进行正则化处理,降低模型的复杂度并提高其泛化能力;
s52:利用GAP对正则化处理后的特征进行降维操作,以便将高维的特征向量降维成分类器所需的一维向量;
s53:将最终得到的特征向量输入softmax层进行故障分类。
优选地,传统的正则化方法是在训练过程中随机丢弃网络层中的神经元,从而减少神经元之间的依赖性。但是,对每个神经元使用相同的丢弃概率并没有考虑到神经元之间的差异。而在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率。具体来说,假设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中,p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
优选地,GAP与传统的池化层不同,它计算每个通道的平均值作为通道输出。这样,GAP就能将特征图的空间维度缩减为单一维度。GAP的计算可通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
以下结合具体实施例进行详细说明:
本发明优选实施例为一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法在美国凯斯西储大学轴承故障诊断数据集(CWRU Bearing Data Center)上的应用。
CWRU轴承数据集由采样频率为12kHz的加速度计从驱动端采集的四种负载条件下的振动数据。振动数据分为故障状态和正常状态,故障状态包括三个损坏部件:内圈、滚珠和外圈,而每个损坏部件又包含三个损坏级别:0.007、0.014和0.021英寸。因此,每个负载下的数据都有10个工作状态。
在本实施例中,振动数据被分为118个样本,每个样本包含1024个连续数据点。然后,从这118个样本中随机抽取78个样本作为训练集,其它样本作为测试集。数据集的具体信息如表1所示。
表1CWRU轴承数据集描述
进一步地,将训练集输入本发明所提出的多尺度残差网络和改进GRU的深度学习模型中进行训练,待诊断准确率上升到稳定后得到训练好的模型,接着将测试集数据输入模型中进行测试。
使用t分布随机邻近嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)方法对0hp负载下的原始数据和所提出模型从原始数据中提取的特征进行处理,以验证所提出模型的特征提取能力。如图5所示,原始数据的不同故障特征为表现出重叠状态并且不能区分。相反,如图6所示,本发明所提出的模型提取的特征分布是可分离的,可以很容易地进行划分,这表明本发明所提出的模型具有优异的特征提取能力。此外,测试集在不同转速下的混淆矩阵如图7所示,所提出的模型准确识别了不同负载条件下的10种工况状态,证明其能够准确识别不同的轴承故障类型。
优选地,为了进一步验证本发明所提模型的优越性,采用CNN、GRU和CNN-GRU作为基本对比模型。同时,为了证明多尺度残差网络卓越的特征提取能力和对GRU改进的有效性,将多尺度残差结构和对GRU的改进作为消融特征,获得了两个消融对比模型。为了便于记录,多尺度残差网络记为MSRN,改进GRU记为EGRU。详细的对比实验结果如表2所示。
表2不同模型的实验结果
从表2可以看出,本发明所提出的模型在四种负载下的诊断准确率都在99.9%以上,且高于其它三种基本对比模型,这表明其优越的故障诊断性能。此外,尽管消融对比模型的诊断准确率比本发明所提出的模型低,但与基本对比模型相比仍具有优势,这证明了本发明所提出的多尺度残差网络卓越的特征提取能力和对GRU改进的有效性。
Claims (10)
1.基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于包括以下步骤:
步骤1:获取滚动轴承运行过程中的原始振动数据;
步骤2:将步骤1获取的原始振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
步骤3:将训练数据集输入多尺度残差网络中进行初步特征提取;
步骤4:将多尺度残差网络提取的局部特征信息输入到改进GRU中,进一步获取时序特征;
步骤5:最终得到的特征信息经过α-Dropout和全局平均池化(Global AveragePooling,GAP)处理后,输入softmax层进行故障分类;
步骤6:重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型;
步骤7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
2.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤3中,多尺度残差网络中进行初步特征提取,包括以下步骤:
S3.1:基本残差块中,给定一个输入信号X,首先,通过一个32×32卷积得到基本特征映射x;
S3.2:随后,将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,i∈{1,2,...,n};与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,通道数为1/n;
S3.3:之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示;此外,每个xi在输入Ci()之前将先与yi-1进行叠加;因此,yi表示为:
S3.4:此外,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y;
S3.5:然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys;S3.6:最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
3.根据权利要求2所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述S3.6中,批归一化BN是一种用于加速神经网络训练过程并提高模型性能的技术;它通过对每个小批量的输入进行归一化操作,将其均值调整为0,方差调整为1,具体来说,对于输入x,它的均值为μ,标准差为σ,经过批归一化之后得到输出的计算公式为:
其中,γ和β分别是缩放因子和平移因子,ε是一个极小的常数,以避免分母为0的情况;
整流线性单元ReLU是一种常用的激活函数,它将负输入值映射为零,而将非负输入值保持不变,ReLU函数的定义如下:
ReLU(x)=max(0,x)
其中,x是输入值。
4.根据权利要求3所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:步骤3中,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n允许学习具有更丰富感受野大小的特征;因为当1<j≤i时,Ci()接受来自所有特征映射子集xj的特性信息;为了简化结构和减少计算,将n设置为4。
5.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤4中,改进GRU重新设计了GRU的复位门,使其与更新门共享权重,并将自归一化指数线性单元(Self-Normalizing Exponential Linear Unit,SELU)作为GRU新的激活函数;
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733;
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出;ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
6.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤5包括以下步骤:
S5.1:通过α-Dropout对改进GRU的输出进行正则化处理;
S5.2:利用GAP对S5.1正则化处理后的特征进行降维操作;
S5.3:将最终得到的特征向量输入softmax层进行故障分类。
7.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.1中,在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率;设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中:p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
8.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.2中,GAP计算每个通道的平均值作为通道输出;这样,GAP就能将特征图的空间维度缩减为单一维度,GAP的计算通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
9.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.3中,将最终得到的特征向量输入softmax层进行故障分类;softmax用于多分类问题中对样本类别的预测,当输入向量Z的维度为n时,第i个维度的分布概率Pi写成:
其中,Zi和Zj分别表示输入向量Z的第i和j个维度。
10.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:步骤6中,多尺度残差网络、改进GRU和后续的优化及分类网络构成故障诊断模型,重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100889.4A CN118094371A (zh) | 2024-01-23 | 2024-01-23 | 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410100889.4A CN118094371A (zh) | 2024-01-23 | 2024-01-23 | 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118094371A true CN118094371A (zh) | 2024-05-28 |
Family
ID=91154084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410100889.4A Pending CN118094371A (zh) | 2024-01-23 | 2024-01-23 | 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118094371A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118533479A (zh) * | 2024-07-19 | 2024-08-23 | 四川农业大学 | 一种航空发动机轴承的故障诊断方法及装置 |
-
2024
- 2024-01-23 CN CN202410100889.4A patent/CN118094371A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118533479A (zh) * | 2024-07-19 | 2024-08-23 | 四川农业大学 | 一种航空发动机轴承的故障诊断方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ewees et al. | Improved artificial bee colony using sine-cosine algorithm for multi-level thresholding image segmentation | |
CN106803247B (zh) | 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法 | |
CN112446891B (zh) | 基于U-Net网络脑胶质瘤的医学图像分割方法 | |
CN111738363B (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
CN112580590A (zh) | 一种基于多语义特征融合网络的指静脉识别方法 | |
CN118094371A (zh) | 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 | |
Huang et al. | Using a noisy U-net for detecting lung nodule candidates | |
CN109801305B (zh) | 基于深度胶囊网络的sar图像变化检测方法 | |
CN115131760B (zh) | 一种基于改进特征匹配策略的轻量级车辆追踪方法 | |
CN113159066B (zh) | 基于类间相似度的分布式标签的细粒度图像识别算法 | |
CN112270286B (zh) | 一种抗阴影干扰的单色视频目标跟踪方法 | |
CN116612378B (zh) | 一种基于ssd改进的不平衡数据及复杂背景下水下小目标检测方法 | |
CN114842238A (zh) | 一种嵌入式乳腺超声影像的识别方法 | |
CN112183237A (zh) | 基于颜色空间自适应阈值分割的白细胞自动分类方法 | |
Qiao et al. | A multi-level thresholding image segmentation method using hybrid Arithmetic Optimization and Harris Hawks Optimizer algorithms | |
CN114596467A (zh) | 基于证据深度学习的多模态影像分类方法 | |
Mahesh et al. | Optimized Local Weber and Gradient Pattern-based medical image retrieval and optimized Convolutional Neural Network-based classification | |
CN116704241A (zh) | 一种全通道3d卷积神经网络高光谱遥感图像分类方法 | |
Nandini et al. | Detection of communicable and non-communicable disease using Lenet-Bi-Lstm model in pathology images | |
Pandey et al. | Solanaceae Family Plants Disease Classification Using Machine Learning Techniques | |
Usha et al. | Feature Selection Techniques in Learning Algorithms to Predict Truthful Data | |
Dhir et al. | A robust cnn-based approach for skin lesion detection and classification | |
Moskovskaya et al. | Predicting dataset size for neural network fine-tuning with a given quality in object detection task | |
Posokhov et al. | Method and algorithms for cascade classification of sulfur print images of billet transverse templates | |
Adi et al. | New Image Texture Feature for Chest X-Ray Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |