Nothing Special   »   [go: up one dir, main page]

CN118094371A - 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 - Google Patents

基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 Download PDF

Info

Publication number
CN118094371A
CN118094371A CN202410100889.4A CN202410100889A CN118094371A CN 118094371 A CN118094371 A CN 118094371A CN 202410100889 A CN202410100889 A CN 202410100889A CN 118094371 A CN118094371 A CN 118094371A
Authority
CN
China
Prior art keywords
fault diagnosis
gru
rolling bearing
improved
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410100889.4A
Other languages
English (en)
Inventor
付文龙
廖伟清
杨棵
谭超
李佰霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202410100889.4A priority Critical patent/CN118094371A/zh
Publication of CN118094371A publication Critical patent/CN118094371A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,包括以下步骤:获取滚动轴承运行过程中的原始振动数据,划分为训练数据集和测试数据集;将训练数据集输入多尺度残差网络中进行初步特征提取;将多尺度残差网络提取的局部特征信息输入到改进GRU中;最终得到的特征信息经过α‑Dropout和全局平均池化处理后,输入softmax层进行故障分类;对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型;将测试数据集输入故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。本发明通过在CNN中引入多尺度结构,有效提取滚动轴承信号的局部特征;同时对GRU进行改进,使其能够更好地捕捉序列数据中的长期依赖关系和时间相关性,提高故障诊断性能和收敛性。

Description

基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法
技术领域
本发明涉及一种滚动轴承故障诊断方法,具体涉及一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法。
背景技术
随着现代工业的迅速发展,旋转机械被广泛应用于制造业、交通运输业、航空航天业等不同领域。滚动轴承作为旋转机械的关键部件,对保证机械设备安全高效的运行起着重要作用。滚动轴承通常在复杂的工作环境中进行高强度的工作,这可能会造成轴承损坏进而引发巨大的经济损失甚至是人员伤亡。因此,对滚动轴承进行有效的故障诊断越来越受到人们的重视。
近年来,深度学习因其强大的特征挖掘能力受到了各个领域的广泛关注,也为故障诊断提供了新的视角。与传统的故障诊断方法相比,深度学习可以自适应地从振动信号中提取故障信息,避免人工处理带来的信息损失。因此,大量的深度学习模型在故障诊断领域得到了应用,其中卷积神经网络(Convolutional Neural Network,CNN)和门控循环单元(Gated Recurrent Unit,GRU)在故障诊断方面取得了显著的成果。但由于转速、负载和故障类型的不同,所获取的滚动轴承振动信号也表现出多尺度特性,而传统的CNN感受野单一,不能有效地处理多尺度特征提取问题。同时,GRU也存在训练时间长、收敛性差和梯度爆炸等问题。
发明内容
针对上述技术问题,本发明提出了一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,通过在卷积神经网络CNN中引入多尺度结构,有效提取滚动轴承信号的局部特征,并利用残差连接来加强特征表示能力。同时对门控循环单元GRU进行改进,使其能够更好地捕捉序列数据中的长期依赖关系和时间相关性,提高故障诊断性能和收敛性。
本发明采取的技术方案为:
基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,包括以下步骤:
步骤1:获取滚动轴承运行过程中的原始振动数据;
步骤2:将步骤1获取的原始振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
步骤3:将训练数据集输入多尺度残差网络中进行初步特征提取;
步骤4:将多尺度残差网络提取的局部特征信息输入到改进GRU中,进一步获取时序特征;
步骤5:最终得到的特征信息经过α-Dropout和全局平均池化(Global AveragePooling,GAP)处理后,输入softmax层进行故障分类;
步骤6:重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型;
步骤7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
所述步骤3中,多尺度残差网络由多个基本残差块级联构成,基本残差块将输入信号按照层次结构进行拆分,并在各分支上进行独立的卷积操作,之后再将卷积输出进行通道级的信息融合,从而得到不同尺度的特征信息;
多尺度残差网络中进行初步特征提取,包括以下步骤:
S3.1:基本残差块中,给定一个输入信号X,首先,通过一个32×32卷积得到基本特征映射x,宽卷积核可以提供更大的感受野以更好的获取全局信息;
S3.2:随后,将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,i∈{1,2,...,n};与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,通道数为1/n。
S3.3:之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示。此外,每个xi在输入Ci()之前将先与yi-1进行叠加。因此,yi表示为:
S3.4:此外,为了更好地融合特征信息,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y。
S3.5:然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys。S3.6:最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
所述S3.6中,批归一化BN是一种用于加速神经网络训练过程并提高模型性能的技术。它通过对每个小批量的输入进行归一化操作,将其均值调整为0,方差调整为1,以使数据分布更稳定。具体来说,对于输入x,它的均值为μ,标准差为σ,经过批归一化之后得到输出 的计算公式为:
其中,γ和β分别是缩放因子和平移因子,ε是一个极小的常数,以避免分母为0的情况。
进一步地,整流线性单元ReLU是一种常用的激活函数,它将负输入值映射为零,而将非负输入值保持不变,ReLU函数的定义如下:
ReLU(x)=max(0,x)
其中,x是输入值。
步骤3中,优选地,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n可能允许学习具有更丰富感受野大小的特征。因为当1<j≤i时,Ci()可以接受来自所有特征映射子集xj的特性信息。为了简化结构和减少计算,本发明将n设置为4。
所述步骤4中,改进GRU重新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并将自归一化指数线性单元(Self-NormalizingExponential Linear Unit,SELU)作为GRU新的激活函数,从而提升网络在训练过程中的自归一化属性。
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733。
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出;ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
所述步骤5包括以下步骤:
S5.1:通过α-Dropout对改进GRU的输出进行正则化处理,降低模型的复杂度并提高其泛化能力;
S5.2:利用GAP对S5.1正则化处理后的特征进行降维操作,以便将高维的特征向量降维成分类器所需的一维向量;
S5.3:将最终得到的特征向量输入softmax层进行故障分类。
S5.1中,在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率。具体来说,假设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中:p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
S5.2中,GAP与传统的池化层不同,它计算每个通道的平均值作为通道输出。这样,GAP就能将特征图的空间维度缩减为单一维度,GAP的计算可通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
S5.3中,将最终得到的特征向量输入softmax层进行故障分类。softmax是一种常用的激活函数,主要用于多分类问题中对样本类别的预测,具体来说,当输入向量Z的维度为n时,第i个维度的分布概率Pi可以写成:
其中,Zi和Zj分别表示输入向量Z的第i和j个维度。
步骤6中,多尺度残差网络、改进GRU和后续的优化及分类网络构成故障诊断模型,重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型。
本发明一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,技术效果如下:1)本发明采用层次结构和通道级的信息融合构建多尺度网络,使其在对不同尺度的特征进行深度挖掘的同时,能够有效减少模型参数,提升网络运行效率,并使用残差连接加强特征表征能力,解决深度神经网络训练过程中出现的梯度消失和梯度爆炸问题。
2)本发明新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并在激活函数中引入SELU,提升网络在训练过程中的自归一化属性,促进信号在训练中靠拢零均值和单位方差,增强对非相关性信号的抗干扰性能。
3)本发明并将SELU作为新的激活函数,引入自归一化属性构建了改进GRU,以便更有效地捕获时间特征。
4)本发明中多尺度残差网络能够对不同尺度的特征进行深度挖掘,并且采用层次结构和通道级的信息融合,有效减少模型参数,提升网络运行效率。
附图说明
图1为本发明所提出的一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法流程图。
图2为本发明所涉及的信号分割和数据集划分示意图。
图3为本发明所提出的多尺度残差网络的基本残差块结构图。
图4为本发明所提出的改进GRU结构图。
图5为本发明优选实施例原始数据可视化分布图。
图6为本发明优选实施例提取的特征可视化分布图。
图7为本发明优选实施例的诊断结果混淆矩阵图。
具体实施方式
为了更加清晰完整的阐述本发明的技术方案,以下结合附图与实施例,对本发明作进一步详细说明。
基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其流程图如图1所示,主要包括以下步骤:
S1:通过数据采集系统,获取滚动轴承运行过程中的原始振动数据;
数据采集系统主要由电机、传动机构、电机驱动器、振动传感器、数据采集板、电脑及其配套软件组成,用于获取滚动轴承在运行过程中的产生的振动信号。
S2:将采集到的振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
数据采集系统采集的振动信号是单一维度的时序信号,在进行故障诊断前,需要分割成特定长度和数量的样本信号,具体的分割方式如图2所示,对于一个总长度为L的信号,假设分割长度为l,则可以得到数量为n=L/l的样本,然后在这个基础上将样本划分为训练数据集和测试数据集。
S3:将训练数据集输入多尺度残差网络中进行初步的特征提取;
不同故障类型的轴承其振动信号虽然具有不同的特点,但未经处理并不易区分,多尺度残差网络从不同尺度进行深入挖掘,可以获取细致的局部特征信息。
S4:将多尺度残差网络提取的局部特征信息,输入改进GRU进一步获取时序特征;
通过多尺度残差网络提取后的特征信息主要是振动信号的局部特征信息,振动信号体现为一组时间序列,利用改进GRU进行时序特征提取能够使得不同状态的滚动轴承振动信号特征区分度更高。
S5:最终得到的特征信息经过α-Dropout和GAP处理后,输入softmax层进行故障分类;
经过多尺度残差网络和改进GRU提取的特征信息具有高度的区分度,使用α-Dropout和GAP进行优化后得到一组一维的特征数据,它们来自不同故障状态的滚动轴承,softmax常用于多分类问题,能够将不同的故障状态数据进行区分,实现故障分类。
S6:重复S3-S5,对多尺度残差网络和改进GRU的参数进行调优,直到训练数据集的诊断准确率上升到稳定后,得到训练好的故障诊断模型;
S7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
进一步地,所述S3中,多尺度残差网络由多个基本残差块级联构成,基本残差块结构图如图3所示,具体来说,给定一个输入信号X,首先通过一个32×32卷积得到基本特征映射x,宽卷积核可以提供更大的感受野以更好的获取全局信息。随后将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,这里i∈{1,2,...,n}。与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,但通道数为1/n。之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示。此外,每个xi在输入Ci()之前将先与yi-1进行叠加。因此,yi可以表示为:
此外,为了更好地融合特征信息,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y。然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys。最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
优选地,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n可能允许学习具有更丰富感受野大小的特征。因为当1<j≤i时,Ci()可以接受来自所有特征映射子集xj的特性信息。为了简化结构和减少计算,本发明将n设置为4。
进一步地,所述S4中,改进GRU的结构图如图4所示,它重新设计了GRU的复位门,使其与更新门共享权重,以减少参数个数,提高网络运行效率,并将SELU作为GRU新的激活函数,从而提升网络在训练过程中的自归一化属性,促进信号在训练中靠拢零均值和单位方差,增强对非相关性信号的抗干扰性能。
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733。
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出,ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
优选地,传统GRU中使用的激活函数tanh在输入超过特定范围时,其导数会趋于零。也就是说,网络很难通过梯度下降来更新权值,甚至会造成梯度消失,降低网络的稳定性。tanh和SELU的函数曲线如图。因此,改进GRU使用SELU作为激活函数不仅可以将自归一化特性融入网络中,还可以避免梯度消失,提高网络的鲁棒性和收敛性。
进一步地,所述S5可以细分为如下三个步骤:
s51:通过α-Dropout对改进GRU的输出进行正则化处理,降低模型的复杂度并提高其泛化能力;
s52:利用GAP对正则化处理后的特征进行降维操作,以便将高维的特征向量降维成分类器所需的一维向量;
s53:将最终得到的特征向量输入softmax层进行故障分类。
优选地,传统的正则化方法是在训练过程中随机丢弃网络层中的神经元,从而减少神经元之间的依赖性。但是,对每个神经元使用相同的丢弃概率并没有考虑到神经元之间的差异。而在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率。具体来说,假设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中,p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
优选地,GAP与传统的池化层不同,它计算每个通道的平均值作为通道输出。这样,GAP就能将特征图的空间维度缩减为单一维度。GAP的计算可通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
以下结合具体实施例进行详细说明:
本发明优选实施例为一种基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法在美国凯斯西储大学轴承故障诊断数据集(CWRU Bearing Data Center)上的应用。
CWRU轴承数据集由采样频率为12kHz的加速度计从驱动端采集的四种负载条件下的振动数据。振动数据分为故障状态和正常状态,故障状态包括三个损坏部件:内圈、滚珠和外圈,而每个损坏部件又包含三个损坏级别:0.007、0.014和0.021英寸。因此,每个负载下的数据都有10个工作状态。
在本实施例中,振动数据被分为118个样本,每个样本包含1024个连续数据点。然后,从这118个样本中随机抽取78个样本作为训练集,其它样本作为测试集。数据集的具体信息如表1所示。
表1CWRU轴承数据集描述
进一步地,将训练集输入本发明所提出的多尺度残差网络和改进GRU的深度学习模型中进行训练,待诊断准确率上升到稳定后得到训练好的模型,接着将测试集数据输入模型中进行测试。
使用t分布随机邻近嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)方法对0hp负载下的原始数据和所提出模型从原始数据中提取的特征进行处理,以验证所提出模型的特征提取能力。如图5所示,原始数据的不同故障特征为表现出重叠状态并且不能区分。相反,如图6所示,本发明所提出的模型提取的特征分布是可分离的,可以很容易地进行划分,这表明本发明所提出的模型具有优异的特征提取能力。此外,测试集在不同转速下的混淆矩阵如图7所示,所提出的模型准确识别了不同负载条件下的10种工况状态,证明其能够准确识别不同的轴承故障类型。
优选地,为了进一步验证本发明所提模型的优越性,采用CNN、GRU和CNN-GRU作为基本对比模型。同时,为了证明多尺度残差网络卓越的特征提取能力和对GRU改进的有效性,将多尺度残差结构和对GRU的改进作为消融特征,获得了两个消融对比模型。为了便于记录,多尺度残差网络记为MSRN,改进GRU记为EGRU。详细的对比实验结果如表2所示。
表2不同模型的实验结果
从表2可以看出,本发明所提出的模型在四种负载下的诊断准确率都在99.9%以上,且高于其它三种基本对比模型,这表明其优越的故障诊断性能。此外,尽管消融对比模型的诊断准确率比本发明所提出的模型低,但与基本对比模型相比仍具有优势,这证明了本发明所提出的多尺度残差网络卓越的特征提取能力和对GRU改进的有效性。

Claims (10)

1.基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于包括以下步骤:
步骤1:获取滚动轴承运行过程中的原始振动数据;
步骤2:将步骤1获取的原始振动信号分割成指定长度的样本,并划分为训练数据集和测试数据集;
步骤3:将训练数据集输入多尺度残差网络中进行初步特征提取;
步骤4:将多尺度残差网络提取的局部特征信息输入到改进GRU中,进一步获取时序特征;
步骤5:最终得到的特征信息经过α-Dropout和全局平均池化(Global AveragePooling,GAP)处理后,输入softmax层进行故障分类;
步骤6:重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型;
步骤7:将测试数据集输入训练好的故障诊断模型中进行故障诊断,确定滚动轴承的健康状况。
2.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤3中,多尺度残差网络中进行初步特征提取,包括以下步骤:
S3.1:基本残差块中,给定一个输入信号X,首先,通过一个32×32卷积得到基本特征映射x;
S3.2:随后,将x在通道层面均匀的拆分为n个特征映射子集,用xi表示,i∈{1,2,...,n};与基本特征映射x相比,每个特征映射子集都具有相同的空间大小,通道数为1/n;
S3.3:之后,除了x1以外,每个xi都有一个对应的5×5卷积,记为Ci(),Ci()的输出用yi表示;此外,每个xi在输入Ci()之前将先与yi-1进行叠加;因此,yi表示为:
S3.4:此外,将得到的新特征映射yi进行拼接操作,得到ym,并通过一个1×1卷积得到和基本特征映射x相同空间大小和通道数的特征映射y;
S3.5:然后,将x和y进行叠加实现跳跃连接,得到具有多尺度属性的混合特征映射ys;S3.6:最后,混合特征映射ys经过批归一化(Batch Normalization,BN)和整流线性单元(Rectified Linear Unit,ReLU)激活层处理后得到输出Y。
3.根据权利要求2所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述S3.6中,批归一化BN是一种用于加速神经网络训练过程并提高模型性能的技术;它通过对每个小批量的输入进行归一化操作,将其均值调整为0,方差调整为1,具体来说,对于输入x,它的均值为μ,标准差为σ,经过批归一化之后得到输出的计算公式为:
其中,γ和β分别是缩放因子和平移因子,ε是一个极小的常数,以避免分母为0的情况;
整流线性单元ReLU是一种常用的激活函数,它将负输入值映射为零,而将非负输入值保持不变,ReLU函数的定义如下:
ReLU(x)=max(0,x)
其中,x是输入值。
4.根据权利要求3所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:步骤3中,在基本残差块中,基本特征映射x的拆分个数n作为尺度维度的控制参数,较大的n允许学习具有更丰富感受野大小的特征;因为当1<j≤i时,Ci()接受来自所有特征映射子集xj的特性信息;为了简化结构和减少计算,将n设置为4。
5.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤4中,改进GRU重新设计了GRU的复位门,使其与更新门共享权重,并将自归一化指数线性单元(Self-Normalizing Exponential Linear Unit,SELU)作为GRU新的激活函数;
SELU的函数表达式为:
其中,x是输入值,ex是指数函数,λ=1.0507,α=1.6733;
改进GRU的计算过程描述为:
st=σ(Ws[ht-1,xt]+bs)
其中:xt是当前时间步的输入,下标t和t-1分别表示当前时刻和前一时刻的隐藏层,σ和SELU为激活函数,Ws和bs分别表示共享权矩阵和偏置值,st表示当前输入和前一刻记忆的组合,at表示从前一刻记忆中保留的信息,表示候选状态向量,ht表示当前时刻隐藏层t的输出;ht-1表示前一时刻隐藏层t-1的输出,/>表示hadamard积。
6.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:所述步骤5包括以下步骤:
S5.1:通过α-Dropout对改进GRU的输出进行正则化处理;
S5.2:利用GAP对S5.1正则化处理后的特征进行降维操作;
S5.3:将最终得到的特征向量输入softmax层进行故障分类。
7.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.1中,在α-Dropout中,引入了一个参数α来控制每个神经元的丢弃概率,并根据神经元的重要性动态调整丢弃概率;设yi表示第i个神经元的输出,其对应的丢弃概率di可以表示为:
其中:p表示初始全局丢弃概率,用于控制在训练过程中被丢弃的神经元比例,超参数α负责调整神经元的重要性与丢弃神经元概率之间的关系。
8.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.2中,GAP计算每个通道的平均值作为通道输出;这样,GAP就能将特征图的空间维度缩减为单一维度,GAP的计算通过以下公式确定:
其中,表示前一个网络第j个通道的输出,N表示输出通道的数量,L表示每个通道的长度,Vj表示第j个通道的降维输出。
9.根据权利要求6所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:S5.3中,将最终得到的特征向量输入softmax层进行故障分类;softmax用于多分类问题中对样本类别的预测,当输入向量Z的维度为n时,第i个维度的分布概率Pi写成:
其中,Zi和Zj分别表示输入向量Z的第i和j个维度。
10.根据权利要求1所述基于多尺度残差网络和改进GRU的滚动轴承故障诊断方法,其特征在于:步骤6中,多尺度残差网络、改进GRU和后续的优化及分类网络构成故障诊断模型,重复步骤3~步骤5,对多尺度残差网络和改进GRU的参数进行调优,得到训练好的故障诊断模型。
CN202410100889.4A 2024-01-23 2024-01-23 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法 Pending CN118094371A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410100889.4A CN118094371A (zh) 2024-01-23 2024-01-23 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410100889.4A CN118094371A (zh) 2024-01-23 2024-01-23 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法

Publications (1)

Publication Number Publication Date
CN118094371A true CN118094371A (zh) 2024-05-28

Family

ID=91154084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410100889.4A Pending CN118094371A (zh) 2024-01-23 2024-01-23 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN118094371A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118533479A (zh) * 2024-07-19 2024-08-23 四川农业大学 一种航空发动机轴承的故障诊断方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118533479A (zh) * 2024-07-19 2024-08-23 四川农业大学 一种航空发动机轴承的故障诊断方法及装置

Similar Documents

Publication Publication Date Title
Ewees et al. Improved artificial bee colony using sine-cosine algorithm for multi-level thresholding image segmentation
CN106803247B (zh) 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法
CN112446891B (zh) 基于U-Net网络脑胶质瘤的医学图像分割方法
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN112580590A (zh) 一种基于多语义特征融合网络的指静脉识别方法
CN118094371A (zh) 基于多尺度残差网络和改进gru的滚动轴承故障诊断方法
Huang et al. Using a noisy U-net for detecting lung nodule candidates
CN109801305B (zh) 基于深度胶囊网络的sar图像变化检测方法
CN115131760B (zh) 一种基于改进特征匹配策略的轻量级车辆追踪方法
CN113159066B (zh) 基于类间相似度的分布式标签的细粒度图像识别算法
CN112270286B (zh) 一种抗阴影干扰的单色视频目标跟踪方法
CN116612378B (zh) 一种基于ssd改进的不平衡数据及复杂背景下水下小目标检测方法
CN114842238A (zh) 一种嵌入式乳腺超声影像的识别方法
CN112183237A (zh) 基于颜色空间自适应阈值分割的白细胞自动分类方法
Qiao et al. A multi-level thresholding image segmentation method using hybrid Arithmetic Optimization and Harris Hawks Optimizer algorithms
CN114596467A (zh) 基于证据深度学习的多模态影像分类方法
Mahesh et al. Optimized Local Weber and Gradient Pattern-based medical image retrieval and optimized Convolutional Neural Network-based classification
CN116704241A (zh) 一种全通道3d卷积神经网络高光谱遥感图像分类方法
Nandini et al. Detection of communicable and non-communicable disease using Lenet-Bi-Lstm model in pathology images
Pandey et al. Solanaceae Family Plants Disease Classification Using Machine Learning Techniques
Usha et al. Feature Selection Techniques in Learning Algorithms to Predict Truthful Data
Dhir et al. A robust cnn-based approach for skin lesion detection and classification
Moskovskaya et al. Predicting dataset size for neural network fine-tuning with a given quality in object detection task
Posokhov et al. Method and algorithms for cascade classification of sulfur print images of billet transverse templates
Adi et al. New Image Texture Feature for Chest X-Ray Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination