CN110672343B - 基于多注意力卷积神经网络的旋转机械故障诊断方法 - Google Patents
基于多注意力卷积神经网络的旋转机械故障诊断方法 Download PDFInfo
- Publication number
- CN110672343B CN110672343B CN201910932922.9A CN201910932922A CN110672343B CN 110672343 B CN110672343 B CN 110672343B CN 201910932922 A CN201910932922 A CN 201910932922A CN 110672343 B CN110672343 B CN 110672343B
- Authority
- CN
- China
- Prior art keywords
- layer
- module
- attention
- channel
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 57
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000001133 acceleration Effects 0.000 claims abstract description 38
- 238000011176 pooling Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 20
- 230000004913 activation Effects 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 13
- 230000005284 excitation Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 2
- 238000005096 rolling process Methods 0.000 claims description 2
- 239000004576 sand Substances 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 20
- 238000012795 verification Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于多注意力卷积神经网络的旋转机械故障诊断方法,首先采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号,并根据各个加速度振动信号所对应的故障状态设置故障状态标签,对每个加速度振动信号进行标准化处理,作为训练样本对多注意力卷积神经网络模型进行训练,多注意力卷积神经网络模型包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层,然后采集旋转机械当前的加速度振动信号,送入多注意力卷积神经网络模型进行故障诊断。本发明在卷积神经网络中引入注意力模块,以增强网络对判别性特征和故障冲击信号段的学习,并抑制无关噪声,提高故障诊断性能。
Description
技术领域
本发明属于旋转机械故障诊断技术领域,更为具体地讲,涉及一种基于多注意力卷积神经网络的旋转机械故障诊断方法。
背景技术
旋转机械是工业设备中应用很广泛的一种部件,一旦发生故障,必将导致设备性能恶化,从而带来经济损失,甚至引发安全事故。因此,对旋转机械进行故障诊断具有重要的意义。
近年来,深度学习技术作为一种高效的特征提取和模式识别算法,解决了以往需要人工提取特征的重要难题。因此,基于去噪自编码器,深度信念网络,卷积神经网络等方法的故障诊断研究取得了大量的研究成果。特别地,卷积神经网络(Convolutional NeuralNetwork,CNN)得益于局部权值共享、局部感受野和多卷积核等特点,在旋转机械故障诊断领域取得了显著的成功。
然而,已发表的成果主要侧重于提升CNN的自动特征学习能力,对以下两方面考虑不足。1)CNN技术倾向于学习输入信号的所有特征,无法对故障相关的特征进行针对性地学习,从而造成巨大的资源浪费;2)针对CNN如何学习到具有判别性的特征这个问题,已发表的成果缺乏充分的研究。这些CNN方法仍是“黑箱”模型,这种“黑箱”的性质很大程度上影响了CNN技术在故障诊断领域的发展,因为可解释性在学术研究和工业应用中都非常重要。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于多注意力卷积神经网络的旋转机械故障诊断方法,在卷积神经网络中引入注意力模块,以增强网络对判别性特征和故障冲击信号段的学习,并抑制无关噪声,提高故障诊断性能。
为实现上述发明目的,本发明基于多注意力卷积神经网络的旋转机械故障诊断方法包括以下步骤:
S1:以采样频率fs采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号xm[n],其中m=1,2,…,M,M表示所采集的加速度振动信号的数量,n=1,2,…,N,N表示每个加速度振动信号中的采样点数量,从而获取加速度振动信号集X={x1[n],x2[n],...,xM[n]};并根据各个加速度振动信号xm[n]所对应的故障状态,设置故障状态标签;
S3:构建多注意力卷积神经网络,包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层,其中:
第1层为卷积层,记作C1层,用于对输入信号进行卷积操作;
第2层为联合注意力模块层,记作U1层,用于对C1层输入至U1层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第3层为卷积层,记作C2层,用于对U1层输入至C1层的数据进行卷积操作;
第4层为联合注意力模块层,记作U2层,用于对C2层输入至U2层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第5层为卷积层,记作C3层,用于对U2层输入至C3层的数据进行卷积操作;
第6层为联合注意力模块层,记作U3层,用于对C3层输入至U3层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第7层为卷积层,记作C4层,用于对U3层输入至C4层的数据进行卷积操作;
第8层为联合注意力模块层,记作U4层,用于对C4层输入至U4层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第9层为卷积层,记作C5层,用于对U4层输入至C5层的数据进行卷积操作;
第10层为联合注意力模块层,记作U5层,用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第11层为卷积层,记作C6层,用于对U5层输入至C6层的数据进行卷积操作;
第12层为全局平均池化层,记作M1层,用于对C6层输入至M1层的数据进行全局平均池化;
第13层为Softmax层,用于对M1层输入至Softmax层的数据估计得到各个故障状态的概率分布,将最大概率对应的故障状态作为故障诊断结果;
本发明基于多注意力卷积神经网络的旋转机械故障诊断方法,首先采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号,并根据各个加速度振动信号所对应的故障状态设置故障状态标签,对每个加速度振动信号进行标准化处理,作为训练样本对多注意力卷积神经网络模型进行训练,多注意力卷积神经网络模型包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层,然后采集旋转机械当前的加速度振动信号,送入多注意力卷积神经网络模型进行故障诊断。
本发明所提出的多注意力卷积神经网络模型,通过引入注意力模块,使卷积神经网络所提取的特征能够自适应优化,从而增强网络对判别性特征和故障冲击信号段的学习,并抑制无关噪声,提高故障诊断性能。
附图说明
图1是本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图;
图2是本发明中多注意力卷积神经网络的示意图;
图3是本实施例中联合注意力模块层的结构图;
图4是本实施例中轮对轴承试验台的结构示意图;
图5是在本发明中配置不同数量联合注意力模块的故障诊断性能对比图;
图6是本发明中配置不同激励注意力模块的故障诊断性能对比图;
图7是图6两种网络结构中每个激励注意力模块时序权重向量的可视化视图;
图8是本发明中配置不同通道注意力模块的故障诊断性能对比图;
图9是图8两种网络结构中每个通道注意力模块时序权重向量的可视化视图;
图10是本发明中配置不同联合注意力模块的故障诊断性能对比图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图。如图1所示,本发明基于多注意力卷积神经网络的旋转机械故障诊断方法的具体步骤包括:
S101:采集旋转机械振动信号样本:
以采样频率fs采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号xm[n],其中m=1,2,…,M,M表示所采集的加速度振动信号的数量,n=1,2,…,N,N表示每个加速度振动信号中的采样点数量,从而获取加速度振动信号集X={x1[n],x2[n],...,xM[n]}。并根据各个加速度振动信号xm[n]所对应的故障状态,设置故障状态标签。
在实际应用中,为了增加样本数量,可以采集M′个包含N′个采样点的加速度振动信号xm′[n′],m′=1,2,…,M′,n′=1,2,…,N′,N′>N,然后采用一个长度为N的滑动窗口,按照预设步长对每个加速度振动信号xm′[n′]进行滑动分割,将所得到的子信号即作为加速度振动信号xm[n]。
S102:数据样本标准化:
其中,μm是xm[n]中所有采样点数据的平均值,σm是xm[n]中所有采样点数据的标准差。
S103:构建多注意力卷积神经网络模型:
图2是本发明中多注意力卷积神经网络的示意图。如图2所示,本发明中所构建的多注意力卷积神经网络包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层,下面分别对每个组成部分进行详细说明。
第1层为卷积层,记作C1层,用于对输入信号进行卷积操作。本实施例中卷积层C1层的步长S=1,卷积核大小为32×1,激动函数采用ReLU函数。
第2层为联合注意力模块层,记作U1层,用于对C1层输入至U1层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整。第3层为卷积层,记作C2层,用于对U1层输入至C1层的数据进行卷积操作。本实施例中C2层的步长S=2,卷积核大小为16×1,激动函数采用ReLU函数。
第4层为联合注意力模块层,记作U2层,用于对C2层输入至U2层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整。
第5层为卷积层,记作C3层,用于对U2层输入至C3层的数据进行卷积操作。本实施例中C3层的步长S=2,卷积核大小为9×1,激动函数采用ReLU函数。
第6层为联合注意力模块层,记作U3层,用于对C3层输入至U3层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整。
第7层为卷积层,记作C4层,用于对U3层输入至C4层的数据进行卷积操作。本实施例中C4层的步长S=2,卷积核大小为6×1,激动函数采用ReLU函数。
第8层为联合注意力模块层,记作U4层,用于对C4层输入至U4层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整。
第9层为卷积层,记作C5层,用于对U4层输入至C5层的数据进行卷积操作。本实施例中C5层的步长S=4,卷积核大小为3×1,激动函数采用ReLU函数。
第10层为联合注意力模块层,记作U5层,用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整。
第11层为卷积层,记作C6层,用于对U5层输入至C6层的数据进行卷积操作。本实施例中C5层的步长S=2,卷积核大小为3×1,激动函数采用ReLU函数。
第12层为全局平均池化层,记作M1层,用于对C6层输入至M1层的数据进行全局平均池化。本发明采用全局平均池化层来替换传统的全连接层,可以避免全连接层导致的过拟合问题。
第13层为Softmax层,用于对M1层输入至Softmax层的数据估计得到各个故障状态的概率分布,将最大概率对应的故障状态作为故障诊断结果。
在实际应用中,联合注意力模块层的具体结构可以根据实际需要进行设置。图3是本实施例中联合注意力模块层的结构图。如图3所示,本实施例中联合注意力模块层包括串联的激励注意力模块和通道注意力模块,下面分别对两个模块进行说明。
如图3所示,激励注意力模块包括第一卷积模块、第二卷积模块、优化模块和加法器,其中:
第一卷积模块用于对输入的特征Y=[y1,y2,…,yW]进行通道数为1的1×1的卷积操作,yj表示特征Y中的第j个特性信号,j=1,2,…,W,W表示特征Y的长度,从而获得特征Y在时序上的投影数据,再将投影数据通过Sigmoid函数处理,将得到的数据作为特征Y对应的W维的时序权重向量s′,并输出至优化模块。
第二卷积模块用于对输入的特征Y聚合局部时序段间的特征信息,即将输入的特征Y通过一个3×3的卷积操作,将所得到的特征Y′输出至优化模块。该模块的主要作用是防止网络对激励冲击信号段的过度聚焦。
加法器将特征Y与优化特征Ys相加,得到特征YMAM=Y+Ys,并输出至通道注意力模块。
如图3所示,通道注意力模块包括平均池化模块、第一卷积模块、第二卷积模块、优化模块和加法器,其中:
平均池化模块用于对特征YMAM每个通道的全局时序信息压缩到一个通道描述符,并生成C维的通道描述符统计向量z,C表示特征YMAM的通道数量,也就是特征Y的通道数量。z的第t个元素通过下式进行计算:
其中,yt(i)表示特征YMAM中第i个时序第t个通道的值,t=1,2,…,C。
第一卷积模块用于对通道描述符统计向量z进行通道数为1的1×1的卷积操作,将得到的数据发送给第二卷积模块,其中激活函数采用ReLU激活函数。
第二卷积模块用于对所接收的数据进行通道数为1的1×1的卷积操作,将得到的数据作为通道特征重校准向量z′发送给优化模块,其中激活函数采用Sigmoid函数,Sigmoid函数用于将输入的激活向量的动态范围压缩到区间[0,1]。第一卷积模块和第二卷积模块实现了一种简单的门机制,可以有效地捕获通道之间的相关性。通道特征重校准向量z′的第i个值用于表示第i个通道的重要性。
优化模块采用通道特征重校准向量z′对特征YMAM进行优化,得到优化特征Yz=[yz 1,yz 2,…,yz C]=YMAM·z′,,将优化特征Yz发送给加法器。
加法器将特征YMAM与优化特征Yz相加,得到特征YJAM=YMAM+Yz,最终将特征YJAM作为联合注意力模块层的输出。
S104:训练多注意力卷积神经网络模型:
S105:获取当前旋转机械振动信号:
S106:故障诊断:
为了更好地说明本发明的技术效果,采用一个具体实施例对本发明进行试验验证。本次实验验证中以高速列车的轮对轴承为例,采用轮对轴承试验台来模拟轮对轴承的工作过程。图4是本实施例中轮对轴承试验台的结构示意图。如图4所示,本实施例中所采用的轮对轴承故障诊断试验台包括驱动电机、皮带传动系统、垂直加载装置、横向加载装置、两个风扇电机和控制系统。垂直和侧向载荷加载装置的设计用于模拟高速列车实际运行中轮对轴承承载的轴向和侧向的载荷。两个风扇电机可以产生与列车运行方向相反的风。通过两个加速度计确保轮对轴承水平方向和垂直方向的振动都能被检测到,信号的采样频率设置为5120Hz。
本次实验验证中预先加工了12种处于不同故障状态的轮对轴承。表1是本实施例中12种故障状态的状态信息。
表1
本次实验验证中所模拟的轮对轴承不同运行状态包括不同运行速度、不同垂向载荷和轴向载荷工况。在每种故障状态下,设计了五种运行速度:60km/h、90km/h、120km/h、150km/h和180km/h,四种不同的垂向的载荷:56kN、146kN、236kN和272kN,以及两个轴向的负载:0kN和20kN。因此,每种故障状态包括四十种不同的工况。通过对原始采集的加速度振动信号进行数据扩展之后,总共有188088个样本,然后对本发明和对比方法进行4-折交叉验证。
为了说明本发明和对比方法的技术性能,对故障诊断结果采用三种指标进行评价,分别为准确率、召回率和精度,这三种评价指标都是较为常用的指标,其具体计算方式在此不再赘述。
首先,在-6dB的噪声下探索了本发明中联合注意力模块的数量对故障诊断性能的影响。本次实验设置了MACNN-1,MACNN-2……MACNN-6共6种网络结构,其中MACNN代表多注意力卷积神经网络,这些网络的数字编号代表MACNN中联合注意力模块的数量。表2是本发明中配置不同数量联合注意力模块的故障诊断结果表。
结构 | 精确率 | 精度 | 召回率 |
MA1DCNN-1 | 76.64±0.82 | 74.62±0.98 | 73.46±1.14 |
MA1DCNN-2 | 78.64±1.34 | 77.05±1.46 | 75.79±1.31 |
MA1DCNN-3 | 82.86±1.16 | 82.22±1.48 | 80.91±1.31 |
MA1DCNN-4 | 82.97±0.83 | 81.87±0.75 | 81.19±0.73 |
MA1DCNN-5 | 83.21±0.61 | 82.50±0.52 | 81.39±0.58 |
MA1DCNN-6 | 82.46±1.03 | 81.67±1.02 | 80.72±1.23 |
表2
图5是在本发明中配置不同数量联合注意力模块的故障诊断性能对比图。如表2和图5所示,当联合注意力模块的数量从1增加到5时,网络的诊断性能也随之增加。这说明不同联合注意力模块所产生的优化效果可以在网络中进行积累,从而不断的提升网络的性能。虽然更多的注意力模块会增加网络的参数量,增加计算时间,MACNN-5的诊断准确率、召回率和精度相比MACNN-1分别增加了6.57%、7.88%和7.93%,所以计算速度的略微降低是可以接受的。此外,随着联合注意力模块数量的增加,网络的性能提升大小越来越小。从图5可以看出MACNN-6的诊断性能相比较MACNN-5有略微的降低,这是因为更多注意力模块的采用,会带来过度优化及过拟合的问题。所以本发明中采用了MACNN-5结构。
其次,在-6dB的噪声下,对激励注意力模块的有效性进行了验证,本次实验设置了1DCNN(不使用任何注意力模块),MA1DCNN-EAM(只使用激励注意力模块)两种网络结构。表3是本发明中配置不同激励注意力模块的故障诊断结果表。
结构 | 精确率 | 精度 | 召回率 |
1DCNN | 70.46±1.55 | 68.19±1.74 | 67.16±1.51 |
MA1DCNN-EAM | 74.90±0.42 | 73.13±0.32 | 71.99±0.59 |
表3
图6是本发明中配置不同激励注意力模块的故障诊断性能对比图。如表3和图6所示,显然MA1DCNN-EAM的故障诊断性能远远好于1DCNN。MA1DCNN-EAM在准确率,召回率和精度三个评价指标中相比1DCNN分别提升了4.44%,4.83%,4.94%。这证明了激励注意力模块可以有效的提高网络的特征学习能力,从而获得更优的诊断结果。为了进一步的理解激励注意力模块的特征学习机制,网络中每一个激励注意力模块中的时序权重向量s′均被输出,图7是图6两种网络结构中每个激励注意力模块时序权重向量的可视化视图。
同时也在-6dB的噪声强度下对通道注意力模块的有效性进行了验证,本次实验设置1DCNN(不使用任何注意力模块),MA1DCNN-CAM(只使用通道注意力)两种网络结构。表4是本发明中配置不同通道注意力模块的故障诊断结果表。
结构 | 精确率 | 精度 | 召回率 |
1DCNN | 70.46±1.55 | 68.19±1.74 | 67.16±1.51 |
MA1DCNN-CAM | 81.67±0.37 | 80.69±0.10 | 79.67±0.45 |
表4
图8是本发明中配置不同通道注意力模块的故障诊断性能对比图。如表4和图8所示,显然MA1DCNN-CAM相比1DCNN在网络的优化速度,网络的故障诊断性能上都具有巨大的优势。其中,MA1DCNN-CAM在准确率,召回率和精度三个评价指标中相比1DCNN分别提升了11.21%,12.51%和11.9%。这表明,通道注意力模块可以从强噪声中学习出更具判别性的故障特征,从而获得更优的诊断结果。此外,为了理解通道注意力模块的特征学习机制,网络中每一个通道注意力模块中的重校准向量z′均被输出。图9是图8两种网络结构中每个通道注意力模块时序权重向量的可视化视图。同样可以看到,不同的注意力模块中的重校准向量,编码了不同的激活映射之间的相对权重,这样网络可以自适应的增强故障相关的激活映射。
然后,对在-6dB的噪声强度下对联合注意力模块的有效性进行了验证。本次实验设置了1DCNN(不包含任何注意力模块),MA1DCNN-JAM(包含联合注意力模块)两种网络结构。表5本发明中配置不同联合注意力模块的的故障诊断结果表。
结构 | 精确率 | 精度 | 召回率 |
1DCNN | 70.46±1.55 | 68.19±1.74 | 67.16±1.51 |
MA1DCNN-JAM | 83.21±0.61 | 82.50±0.52 | 81.39±0.58 |
表5
图10是本发明中配置不同联合注意力模块的故障诊断性能对比图。如表5和图10所示,MA1DCNN-JAM在准确率、召回率和精度三个评价指标中相比1DCNN分别提升了12.75%,14.23%和14.31%。这说明联合注意力模块可以有效的提升网络的诊断性能。从表5可以看出联合注意力模块的故障诊断性能同样优于通道注意力模块和激励注意力模块。这说明通道注意力模块和激励注意力模块可以相互促进共同优化,从而提升网络的故障诊断性能。
最后验证本发明(MA1DCNN)和其他对比方法在不同噪声环境下的诊断性能。本次实验验证中设置了五种对比方法,分别是基于2维CNN的Wen-CNN(见文献“L.Wen,X.Li,L.Gao,and Y.Zhang,"Anew convolutional neural network-based data-driven faultdiagnosis method,"IEEE T.Ind.Electron.,65,pp.5990-5998,(2018).”)和ADCNN(见文献“X.Guo,L.Chen and C.Shen,"Hierarchical adaptive deep convolution neuralnetwork and its application to bearing fault diagnosis,"Measurement,93,pp.490-502,(2016).”),基于1维CNN的WDCNN(见文献“W.Zhang,G.Peng,C.Li,Y.Chen,andZ.Zhang,"A new deep learning model for fault diagnosis with good anti-noiseand domain adaptation ability on raw vibration signals,"Sensors-Basel,17,pp.425-446,(2017).”),基于多尺度学习的CNN方法:MSCNN(见文献“G.Jiang,H.He,J.Yan,and P.Xie,"Multiscale convolutional neural networks for fault diagnosis ofwind turbine gearbox,"IEEE T.Ind.Electron.,PP,pp.1-12,(2018).”),与文献“G.F.Bin,J.J.Gao,X.J.Li,and B.S.Dhillon,"Early fault diagnosis of rotatingmachinery based on wavelet packets—Empirical mode decomposition featureextraction and neural network,"Mech.Syst.Signal Pr.,27,pp.696-711,(2012).”中相同结构的4层BPNN。本次实验验证中本发明和五种对比方法的训练策略一致。本次实验验证中设置了3组在不同SNR(-6dB,0dB,6dB)下的实验,分别模拟轮对轴承处在多种不同强度噪声工况下。表6是本次实验验证中本发明和五种对比方法的故障诊断结果评价指标对比表。
表6
如表6所示,本发明的准确率、召回率和精度在所有噪声情况下均优于其他对比方法。特别地,在SNR=-6dB时,本发明仍然获得了83.21%的诊断准确率,这相比Wen-CNN有几乎10.71%的提升,说明本发明在无任何额外的去噪预处理的情况下,具有较强的抗噪性能。此外随着噪声的增加,故障诊断方法的性能会下降。例如,噪声从0dB变成-6dB,噪声强度相比原始信号增加了3.98倍。Wen-CNN,ADCNN,WDCNN,ResCNN和BPNN的诊断准确率分别下降了22.53%,20.40%,20.68%,21.87%和24.24%。但是本发明仅下降14.42%,这进一步说明本发明相比其他方法具有更强的抗噪性能和故障诊断性能。另一方面,从方差结果看到,本发明在大多数情况下其故障诊断的稳定性优于其他五种对比方法。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (2)
1.一种多注意力卷积神经网络的旋转机械故障诊断方法,其特征在于,包括以下步骤:
S1:以采样频率fs采集无故障和不同故障的旋转机械在不同运行状态下的加速度振动信号xm[n],其中m=1,2,…,M,M表示所采集的加速度振动信号的数量,n=1,2,…,N,N表示每个加速度振动信号中的采样点数量,从而获取加速度振动信号集X={x1[n],x2[n],...,xM[n]};并根据各个加速度振动信号xm[n]所对应的故障状态,设置故障状态标签;
S3:构建多注意力卷积神经网络,包括6个卷积层、5个联合注意力模块以及全局平均池化层和Softmax层,其中:
第1层为卷积层,记作C1层,用于对输入信号进行卷积操作;
第2层为联合注意力模块层,记作U1层,用于对C1层输入至U1层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第3层为卷积层,记作C2层,用于对U1层输入至C1层的数据进行卷积操作;
第4层为联合注意力模块层,记作U2层,用于对C2层输入至U2层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第5层为卷积层,记作C3层,用于对U2层输入至C3层的数据进行卷积操作;
第6层为联合注意力模块层,记作U3层,用于对C3层输入至U3层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第7层为卷积层,记作C4层,用于对U3层输入至C4层的数据进行卷积操作;
第8层为联合注意力模块层,记作U4层,用于对C4层输入至U4层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;
第9层为卷积层,记作C5层,用于对U4层输入至C5层的数据进行卷积操作;
第10层为联合注意力模块层,记作U5层,用于对C5层输入至U5层的特征的通道特征和时序段给予不同的权重,从不同角度对特征进行自适应调整;联合注意力模块层包括串联的激励注意力模块和通道注意力模块:
激励注意力模块包括第一卷积模块、第二卷积模块、优化模块和加法器,其中:
第一卷积模块用于对输入的特征Y=[y1,y2,…,yW]进行通道数为1的1×1的卷积操作,yj表示特征Y中的第j个特性信号,j=1,2,…,W,W表示特征Y的长度,从而获得特征Y在时序上的投影数据,再将投影数据通过Sigmoid函数处理,将得到的数据作为特征Y对应的W维的时序权重向量s′,并输出至优化模块;
第二卷积模块用于对输入的特征Y进行一个3×3的卷积操作,将所得到的特征Y′输出至优化模块;
加法器将特征Y与优化特征Ys相加,得到特征YMAM=Y+Ys,并输出至通道注意力模块;
通道注意力模块包括平均池化模块、第一卷积模块、第二卷积模块、优化模块和加法器,其中:
平均池化模块用于对特征YMAM每个通道的全局时序信息压缩到一个通道描述符,并生成C维的通道描述符统计向量z,C表示特征YMAM的通道数量;
第一卷积模块用于对通道描述符统计向量z进行通道数为1的1×1的卷积操作,将得到的数据发送给第二卷积模块,其中激活函数采用ReLU激活函数;
第二卷积模块用于对所接收的数据进行通道数为1的1×1的卷积操作,将得到的数据作为通道特征重校准向量z′发送给优化模块,其中激活函数采用Sigmoid函数;
优化模块采用通道特征重校准向量z′对特征YMAM进行优化,得到优化特征Yz=[yz 1,yz 2,…,yz C]=YMAM·z′,将优化特征Yz发送给加法器;
加法器将特征YMAM与优化特征Yz相加,得到特征YJAM=YMAM+Yz,最终将特征YJAM作为联合注意力模块层的输出;
第11层为卷积层,记作C6层,用于对U5层输入至C6层的数据进行卷积操作;
第12层为全局平均池化层,记作M1层,用于对C6层输入至M1层的数据进行全局平均池化;
第13层为Softmax层,用于对M1层输入至Softmax层的数据估计得到各个故障状态的概率分布,将最大概率对应的故障状态作为故障诊断结果;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910932922.9A CN110672343B (zh) | 2019-09-29 | 2019-09-29 | 基于多注意力卷积神经网络的旋转机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910932922.9A CN110672343B (zh) | 2019-09-29 | 2019-09-29 | 基于多注意力卷积神经网络的旋转机械故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110672343A CN110672343A (zh) | 2020-01-10 |
CN110672343B true CN110672343B (zh) | 2021-01-26 |
Family
ID=69080021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910932922.9A Expired - Fee Related CN110672343B (zh) | 2019-09-29 | 2019-09-29 | 基于多注意力卷积神经网络的旋转机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110672343B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275643B (zh) * | 2020-01-20 | 2022-09-02 | 西南科技大学 | 基于通道和空间注意力的真实噪声盲去噪网络系统及方法 |
CN111458148A (zh) * | 2020-04-26 | 2020-07-28 | 上海电机学院 | 一种基于cbam的卷积神经网络滚动轴承故障诊断方法 |
CN111721535B (zh) * | 2020-06-23 | 2021-11-30 | 中国人民解放军战略支援部队航天工程大学 | 一种基于卷积多头自注意力机制的轴承故障检测方法 |
CN112070019B (zh) * | 2020-09-08 | 2024-05-28 | 河南威虎智能科技有限公司 | 一种人脸识别方法、装置、电子设备和存储介质 |
CN112284736B (zh) * | 2020-10-23 | 2022-02-01 | 天津大学 | 一种基于多通道注意力模块的卷积神经网络故障诊断方法 |
CN112577747B (zh) * | 2020-12-07 | 2023-08-08 | 东南大学 | 一种基于空间池化网络的滚动轴承故障诊断方法 |
CN112834921B (zh) * | 2020-12-23 | 2022-07-15 | 浙江工业大学 | 一种基于残差图注意力网络的电机故障诊断方法 |
CN112816122B (zh) * | 2020-12-31 | 2023-04-07 | 武汉地震工程研究院有限公司 | 基于深度学习和压电主动传感的螺栓松紧程度监测方法 |
CN113011558B (zh) * | 2021-02-25 | 2023-08-04 | 山东大学 | 基于多异构传感器信息融合的机器人故障诊断方法及系统 |
CN113516023B (zh) * | 2021-04-23 | 2024-06-28 | 广东电网有限责任公司计量中心 | 设备振动异常诊断方法和系统 |
CN113221973B (zh) * | 2021-04-26 | 2022-04-19 | 武汉科技大学 | 一种可解释的空调系统深度神经网络故障诊断方法 |
CN113221996A (zh) * | 2021-04-30 | 2021-08-06 | 山东大学 | 一种基于多头注意力机制的轴承故障诊断方法及系统 |
CN113822139B (zh) * | 2021-07-27 | 2023-08-25 | 河北工业大学 | 一种基于改进1DCNN-BiLSTM的设备故障诊断方法 |
CN114298087B (zh) * | 2021-12-03 | 2024-07-12 | 中铁第一勘察设计院集团有限公司 | 一种基于注意力机制的混合cnn-lstm吊弦异常检测方法 |
CN116660982B (zh) * | 2023-08-02 | 2023-09-29 | 东北石油大学三亚海洋油气研究院 | 一种基于注意力卷积神经网络的全波形反演方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180144208A1 (en) * | 2016-11-18 | 2018-05-24 | Salesforce.Com, Inc. | Adaptive attention model for image captioning |
CN108304960A (zh) * | 2017-12-29 | 2018-07-20 | 中车工业研究院有限公司 | 一种轨道交通设备故障诊断方法 |
CN109299705A (zh) * | 2018-10-24 | 2019-02-01 | 电子科技大学 | 基于一维深度残差卷积神经网络的旋转机械故障诊断方法 |
CN109389055A (zh) * | 2018-09-21 | 2019-02-26 | 西安电子科技大学 | 基于混合卷积和注意力机制的视频分类方法 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN110287876A (zh) * | 2019-06-25 | 2019-09-27 | 黑龙江电力调度实业有限公司 | 一种基于视频图像的内容识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201311360Y (zh) * | 2008-06-20 | 2009-09-16 | 四川恒达电子科技有限公司 | 一种振动在线监测故障诊断装置 |
CN109596326B (zh) * | 2018-11-30 | 2020-06-12 | 电子科技大学 | 基于优化结构卷积神经网络的旋转机械故障诊断方法 |
-
2019
- 2019-09-29 CN CN201910932922.9A patent/CN110672343B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180144208A1 (en) * | 2016-11-18 | 2018-05-24 | Salesforce.Com, Inc. | Adaptive attention model for image captioning |
CN108304960A (zh) * | 2017-12-29 | 2018-07-20 | 中车工业研究院有限公司 | 一种轨道交通设备故障诊断方法 |
CN109389055A (zh) * | 2018-09-21 | 2019-02-26 | 西安电子科技大学 | 基于混合卷积和注意力机制的视频分类方法 |
CN109299705A (zh) * | 2018-10-24 | 2019-02-01 | 电子科技大学 | 基于一维深度残差卷积神经网络的旋转机械故障诊断方法 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN110287876A (zh) * | 2019-06-25 | 2019-09-27 | 黑龙江电力调度实业有限公司 | 一种基于视频图像的内容识别方法 |
Non-Patent Citations (4)
Title |
---|
A Light-weight Fault-Tolerant Time Synchronization for Wireless Sensor Networks;Sakpong Seareesavetrat等;《IEEE》;20091231;1-5 * |
An improved deep convolutional neural network with multi-scale information for bearing fault diagnosis;Wenyi Huang等;《Neurocomputing》;20190329;77-92 * |
基于时频融合和注意力机制的深度学习行星齿轮箱故障诊断方法;孔子迁等;《仪器仪表学报》;20190630;第40卷(第6期);221-226 * |
基于词注意力卷积神经网络模型的情感分析研究;王盛玉等;《中文信息学报》;20180930;第32卷(第9期);123-131 * |
Also Published As
Publication number | Publication date |
---|---|
CN110672343A (zh) | 2020-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110672343B (zh) | 基于多注意力卷积神经网络的旋转机械故障诊断方法 | |
CN110595775B (zh) | 基于多分支多尺度卷积神经网络的滚动轴承故障诊断方法 | |
CN109299705B (zh) | 基于一维深度残差卷积神经网络的旋转机械故障诊断方法 | |
Jia et al. | GTFE-Net: A gramian time frequency enhancement CNN for bearing fault diagnosis | |
Youcef Khodja et al. | Rolling element bearing fault diagnosis for rotating machinery using vibration spectrum imaging and convolutional neural networks | |
CN108319962B (zh) | 一种基于卷积神经网络的刀具磨损监测方法 | |
CN113567130A (zh) | 基于设备多工况的轴承故障诊断方法 | |
CN108510153A (zh) | 一种多工况旋转机械故障诊断方法 | |
CN112393934B (zh) | 基于稀疏自编码与极限学习机的风电机组故障诊断方法 | |
CN106096562A (zh) | 基于振动信号盲源分离和稀疏成分分析的风电机组齿轮箱故障诊断方法 | |
CN113865872B (zh) | 基于小波包重构成像和cnn的轴承故障诊断方法 | |
Laala et al. | Bearing faults classification based on wavelet transform and artificial neural network | |
CN115392323A (zh) | 基于云边协同的轴承故障监测方法及系统 | |
Ming et al. | rgfc-Forest: An enhanced deep forest method towards small-sample fault diagnosis of electromechanical system | |
CN116106016A (zh) | 一种基于联合学习卷积神经网络的滚动轴承故障诊断方法 | |
CN116256174A (zh) | 基于可解释性多层小波驱动的噪声鲁棒轴承故障诊断方法 | |
CN114459760B (zh) | 一种强噪声环境下的滚动轴承故障诊断方法及系统 | |
CN113673442B (zh) | 一种基于半监督单分类网络的变工况故障检测方法 | |
Sadoughi et al. | A physics-based deep learning approach for fault diagnosis of rotating machinery | |
CN115099278A (zh) | 一种基于小波包时频图与ResNet迁移网络的设备状态诊断方法 | |
CN115235759A (zh) | 一种基于宽度学习的风机齿轮箱早期故障诊断方法 | |
CN113758709A (zh) | 结合边缘计算和深度学习的滚动轴承故障诊断方法及系统 | |
CN117171544B (zh) | 基于多通道融合卷积神经网络的电机振动故障诊断方法 | |
Lu et al. | An automated bearing fault diagnosis using a self-normalizing convolutional neural network | |
Li et al. | A robust fault diagnosis method for rolling bearings based on deep convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210126 |