CN112613226B - 一种用于剩余寿命预测的特征增强方法 - Google Patents
一种用于剩余寿命预测的特征增强方法 Download PDFInfo
- Publication number
- CN112613226B CN112613226B CN202011432003.4A CN202011432003A CN112613226B CN 112613226 B CN112613226 B CN 112613226B CN 202011432003 A CN202011432003 A CN 202011432003A CN 112613226 B CN112613226 B CN 112613226B
- Authority
- CN
- China
- Prior art keywords
- data
- test
- sample
- training
- rul
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/15—Vehicle, aircraft or watercraft design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Automation & Control Theory (AREA)
- Aviation & Aerospace Engineering (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
一种用于剩余寿命预测的特征增强方法,属于航空发动机故障预测与健康管理领域。首先,对发动机传感器数据归一化处理,计算训练集数据和测试集数据的剩余寿命值。其次,对训练数据集和测试数据集进行降维处理,以滑动窗口的方式来提取训练数据集样本和测试数据集样本。再次,对训练集样本和测试及样本进行数据特征增强,确定数据特征增强后的样本。最后,设置深度学习神经网络长短期记忆结构,加入样本进行训练,利用神经网络模型对测试数据进行预测。本发明本基于数据驱动的形式建立深度神经网络模型,与实际的发动机型号无关,通过训练不同数据集既可将模型迁移到不同型号发动机上使用,具有一定的普适性。
Description
技术领域
本发明提出了一种新的基于Tensorflow深度学习框架的航空发动机系统或组件剩余寿命预测的数据增强方法,属于航空发动机故障预测与健康管理(PHM)领域。
背景技术
本发明的研究对象为NASA公开的涡轮风扇发动机退化仿真数据集。该数据集使用C-MAPSS进行发动机退化仿真,在不同的条件和故障模式组合下模拟了四个不同的集合,记录多个传感器通道数据以表征故障演变。
该数据集分为四个子数据集,每个数据集都被分为训练数据集,测试数据集和真实的系统或组件剩余寿命值(RUL)。对每个子数据集来说,训练数据集和测试数据集都由多个参数组成,参数包含发动机引擎号,时间序列,3种发动机操作设置参数以及21种传感器参数数据,参数均为时间序列参数。
发动机在每个时间序列开始时工作正常,然后在时间序列某个时间点出现故障。在训练集中,故障不断增大,直到系统失效。在测试集中,时间序列在系统故障前的某个时间结束。我们需要做的是基于所给的完整的训练数据集去预测测试集故障前剩余的运行周期数,即发动机在最后一个运行周期后仍将继续运行的运行周期数。每个子数据集的RUL文件也为测试数据对应的引擎提供了真实剩余有用寿命(RUL)值。
对于时间序列的涡轮风扇发动机退化仿真数据集,目前的方法大多数采用的是循环神经网络(RNN)来对数据集进行训练并预测,而长短期记忆网络(LSTM)也是证实取得非常成功的一种RNN网络模型,广泛应用于语音识别,机器翻译等方面。LSTM解决了一般RNN会出现的梯度消失或梯度爆炸的问题,采用输入门,遗忘门和输出门来控制信息流,而此涡轮风扇发动机的传感器数据的固有顺序属性也意味着它适合用LSTM来进行RUL预测。
发明内容
针对直接使用标准归一化的数据加入到LSTM网络中训练无法充分学习和挖掘原数据集特征和信息的问题,本发明提出了一种基于数据增加的特征提取方法。
本发明的技术方案为:
一种新的用于剩余寿命预测的特征增强方法,包括以下步骤:
S1.对发动机传感器数据进行归一化处理,包括以下步骤:
S1.1读取公开的NASA涡轮风扇发动机训练集数据train_FD001,测试集数据test_FD001和剩余寿命数据集数据RUL_FD001(公开数据集包含四组已划分的子数据集,每组子数据集分为训练数据集,测试数据集和剩余寿命数据集,这里以第一组子数据集为例);
S1.2读取的训练集数据train_FD001和测试集数据test_FD001的传感器参数数据均为时间序列的数据,采用最大最小值归一化方法对传感器数据进行归一化处理,得到归一化后训练集数据train_01_ru和测试集数据test_01_ru,归一化公式如下:
式中,x为归一化前传感器参数数据,x′为归一化后传感器参数数据,xmin为传感器参数的最小值,xmax为传感器参数最大值;
S2.根据S1所得到的训练集数据train_01_ru,测试集数据test_01_ru和剩余寿命数据集RUL_FD001,计算训练集数据和测试集数据的剩余寿命RUL值,包括以下步骤:
S2.1找到训练数据集每个发动机引擎号id对应的最大发动机循环数cyclemax_train(训练数据集数据中第一列和第二列参数分别为发动机引擎号和发动机循环数),利用cyclemax_train减去发动机循环数cyclet_train,即可得到该发动机循环数下对应的剩余寿命RULt_train值;
S2.2找到测试数据集每个发动机引擎号id对应的最大发动机循环数cycletest(测试数据集数据中第一列和第二列参数分别为发动机引擎号和发动机循环数),该发动机循环数加上剩余寿命数据集中的RUL值(该数据集只包含每个发动机引擎号对应的剩余寿命RUL值),得到发动机最大循环数cyclemax_test,利用cyclemax_test减去发动机循环数cyclet_test,即可得到该发动机循环数下对应的剩余寿命RULt_test值;
S2.3设定最大剩余寿命RULmax值为125,重新计算训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,计算公式如下:
式中,RULt为训练集数据剩余寿命RULt_train值或测试集数据剩余寿命RULt_test值;
S3.对S2所求出的归一化训练数据集和测试数据集进行降维处理,即将传感器参数数据中参数值保持不变的传感器参数数据从数据集中剔除,让剩余的传感器参数数据作为样本原数据;
S4.根据S3降维处理的训练数据集train_01_ru和测试数据集test_01_ru以及S2求得的训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,以滑动窗口的方式来提取训练数据集样本和测试数据集样本,包括以下步骤:
S4.1找到训练数据集每个发动机引擎号id对应的最大发动机循环数cyclemax_train,并取出其中的最小值cyclemax_train_min,设定滑动窗口大小winSize接近且不超过此最小值cyclemax_train_min;
S4.2以滑动窗口大小winSize为行,降维传感器参数数据FeaSize为列对训练数据集train_01_ru和测试数据集test_01_ru进行样本提取,此时的样本为winSize为行,FeaSize为列的2维矩阵,其对应网络的输出为发动机剩余寿命(取样本最后时间序列对应的RULt),此时的训练数据集输入样本为trainX_New,测试数据集输入样本为testX_New,训练数据集输出样本为trainY,测试集数据输出样本为testY;
S5.利用手工特征提取的方式对S4获取的训练集样本trainX_New和测试及样本testX_New进行数据特征增强,对每个样本增加岭回归权重,样本均值,样本最大值,样本最小值四个特征值,扩充样本维度,确定数据特征增强后的样本,包括以下步骤:
S5.1对于S4获取的训练集样本trainX_New和测试及样本testX_New,分别计算出各传感器参数的岭回归权重值coef,均值mean,最大值max和最小值min;
S5.2对于求出的四个特征值,以winSize增强的方式添加到样本中,得到最终数据特征增强的样本,此时样本为以winSize+4为行,FeaSize为列的2维矩阵,我们定义最终的训练集样本为trainX_reNew,最终的测试集样本为testX_New,其对应的输出发动机剩余寿命RULt值不变,即trainY和testY不变;
S6.设置深度学习神经网络长短期记忆(LSTM)结构,加入样本进行训练,利用训练好的神经网络模型对测试数据进行预测,包括以下步骤:
S6.1建立Sequential顺序模型结构,它是网络层的线性堆栈;
S6.2添加LSTM层以及NN层,LSTM层结构一般设置为3~4层神经网络结构,NN层一般设置为1~2层神经网络结构,并使用Dropout函数来防止神经网络模型学习的过拟合,激活函数采用雷诺函数(RELU);
S6.3选取网络的优化器optimizer,目标损失函数loss,批处理量batch_size以及训练次数epochs,将输入样本trainX_reNew和输出样本trainY添加到网络中进行训练,得到预测模型;
S6.4将训练好的预测模型对测试集testX_reNew进行预测,并结合testY进行模型预测对比,得到预测结果rmse和score,
其中rmse为均方根误差,计算方式为
上式中,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue(即RUL_FD001数据RUL值)之间的误差。
score为评分函数,计算方式为
同样,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue之间的误差。
本发明的有益效果为:一种新的用于剩余寿命预测的特征增强方法能够实现更优化更稳定的深度LSTM网络预测模型,和直接对数据进行归一化训练的深度LSTM网络相比,其网络的目标函数的均方根误差rmse和score均有一定程度的降低,网络模型的预测精度得到一定提高,另外,多次试验的结果也表明其网络模型的预测稳定性也有一定程度的提升。本方法基于数据驱动的形式建立深度神经网络模型,与实际的发动机型号无关,因此通过训练不同数据集就可以将模型方便地迁移到不同型号发动机上使用,具有一定的普适性。
附图说明
图1为基于深度学习的CMPASS数据集系统或组件剩余寿命预测流程图;
图2为三种不同方式下的数据处理流程图(其中第三种方法为本发明提供的方法);
图3为本文神经网络模型结构图。
具体实施方式
下面结合附图对本发明一种新的用于剩余寿命预测的特征增强方法作进一步说明。
本发明依托背景为NASA公开的涡轮风扇发动机退化仿真数据集,基于一种新的用于剩余寿命预测的特征增强方法流程如图1所示。
图2为三种方法分别处理数据以及训练网络的流程图,图2中前两种方法是比较常规的方法,第一种是仅仅对原数据进行归一化处理之后,以滑动窗口的方式确定样本,来进行网络的训练,用于预测RUL,第二种方法与第一种方法类似,区别在于将原数据求特征值来替代原数据进行后续训练网络和预测操作,本文方法是第三种,主要步骤包括:
S1.确定数据集为NASA公开的涡轮风扇发动机退化仿真数据集,该数据集包含四个子数据集,每个子数据集都包含训练数据集、测试数据集以及RUL数据集,明确目的是根据训练数据集对深度学习神经网络进行训练,用于测试数据集,并比较预测结果与实际RUL数据的差别;
S2.对发动机传感器数据进行归一化处理,包括以下步骤:
S2.1读取公开的NASA涡轮风扇发动机训练集数据train_FD001,测试集数据test_FD001和剩余寿命数据集数据RUL_FD001(公开数据集包含四组已划分的子数据集,每组子数据集分为训练数据集,测试数据集和剩余寿命数据集,这里以第一组子数据集为例);
S2.2读取的训练集数据train_FD001和测试集数据test_FD001的传感器参数数据均为时间序列的数据,采用最大最小值归一化方法对传感器数据进行归一化处理,得到归一化后训练集数据train_01_ru和测试集数据test_01_ru,归一化公式如下:
式中,x为归一化前传感器参数数据,x′为归一化后传感器参数数据,xmin为传感器参数的最小值,xmax为传感器参数最大值;
S3.根据S2所得到的训练集数据train_01_ru,测试集数据test_01_ru和剩余寿命数据集RUL_FD001,计算训练集数据和测试集数据的剩余寿命RUL值,包括以下步骤:
S3.1找到训练数据集每个发动机引擎号id对应的最大发动机循环数cyclemax_train(训练数据集数据中第一列和第二列参数分别为发动机引擎号和发动机循环数),利用cyclemax_train减去发动机循环数cyclet_train,即可得到该发动机循环数下对应的剩余寿命RULt_train值;
S3.2找到测试数据集每个发动机引擎号id对应的最大发动机循环数cycletest(测试数据集数据中第一列和第二列参数分别为发动机引擎号和发动机循环数),该发动机循环数加上剩余寿命数据集中的RUL值(该数据集只包含每个发动机引擎号对应的剩余寿命RUL值),得到发动机最大循环数cyclemax_test,利用cyclemax_test减去发动机循环数cyclet_test,即可得到该发动机循环数下对应的剩余寿命RULt_test值;
S3.3设定最大剩余寿命RULmax值为125,重新计算训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,计算公式如下:
式中,RULt为训练集数据剩余寿命RULt_train值或测试集数据剩余寿命RULt_test值;
S4.对S3所求出的归一化训练数据集和测试数据集进行降维处理,即将传感器参数数据中参数值保持不变的传感器参数数据从数据集中剔除(观察此数据集可以发现其中有7种传感器数据参数值在给定的时间序列中保持恒定值,假设传感器参数分别为s1,s2,...,则s1,s5,s6,s10,s16,s18,s19参数值恒定,剔除此类数据来达到降维效果),让剩余的传感器参数数据作为样本原数据;
S5.根据S4降维处理的训练数据集train_01_ru和测试数据集test_01_ru以及S3求得的训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,以滑动窗口的方式来提取训练数据集样本和测试数据集样本,包括以下步骤:
S5.1找到训练数据集每个发动机引擎号id对应的最大发动机循环数cyclemax_train,并取出其中的最小值cyclemax_train_min(试验中求得四个子数据集对应的此值分别为31,21,38,19),设定滑动窗口大小winSize接近且不超过此最小值cyclemax_train_min(设定滑动窗口大小winSize分别为30,20,38,19);
S5.2以滑动窗口大小winSize为行,降维传感器参数数据FeaSize为列对训练数据集train_01_ru和测试数据集test_01_ru进行样本提取,此时的样本为winSize为行,FeaSize为列的2维矩阵,其对应网络的输出为发动机剩余寿命(取样本最后时间序列对应的RULt),此时的训练数据集输入样本为trainX_New,测试数据集输入样本为testX_New,训练数据集输出样本为trainY,测试集数据输出样本为testY;
S6.利用手工特征提取的方式对S5获取的训练集样本trainX_New和测试及样本testX_New进行数据特征增强,对每个样本增加岭回归权重,样本均值,样本最大值,样本最小值四个特征值,扩充样本维度,确定数据特征增强后的样本,包括以下步骤:
S6.1对于S5获取的训练集样本trainX_New和测试及样本testX_New,分别计算出各传感器参数的岭回归权重值coef,均值mean,最大值max和最小值min,其中岭回归权重值coef可以利用sklearn工具包的linear_model模型中RidgeCV()函数求得,传感器参数的均值,最大值和最小值均可由numpy工具包的对应函数mean(),max()和min()求得;
S6.2对于求出的四个特征值,以winSize增强的方式添加到样本中,得到最终数据特征增强的样本,此时样本为以winSize+4为行,FeaSize为列的2维矩阵,我们定义最终的训练集样本为trainX_reNew,最终的测试集样本为testX_New,其对应的输出发动机剩余寿命RULt值不变,即trainY和testY不变;
S7.设置深度学习神经网络长短期记忆(LSTM)结构,加入样本进行训练,利用训练好的神经网络模型对测试数据进行预测,包括以下步骤:
S7.1建立Sequential顺序模型结构,它是网络层的线性堆栈;
S7.2添加LSTM层以及NN层,LSTM层结构一般设置为3~4层神经网络结构,NN层一般设置为1~2层神经网络结构,并使用Dropout函数来防止神经网络模型学习的过拟合,激活函数采用雷诺函数(RELU),其网络结构如图3所示,即采用了4层LSTM网络结构,其记忆单元的个数分别为64,64,8,8,采用了两层NN结构,其神经元节点个数分别为16,1;
RELU函数的表达式如下
f(x)=max(0,x)
式中x为函数输入,对于神经元给定的输入时,上式变为
f(x)=max(0,x)=max(0,WTx+b)
式中WT为神经元权重,b为神经元偏置量;
S7.3选取网络的优化器optimizer为rmsprop,目标损失函数loss为均方误差mse,批处理量batch_size为512以及训练次数epochs为100,将输入样本trainX_reNew和输出样本trainY添加到网络中进行训练,得到预测模型;
S7.4将训练好的预测模型对测试集testX_reNew进行预测,并结合testY进行模型预测对比,得到预测结果rmse和score,
其中rmse为均方根误差,计算方式为
上式中,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue(即RUL_FD001数据RUL值)之间的误差。
score为评分函数,计算方式为
同样,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue之间的误差。
表1,表2和表3是根据图2中三种不同的数据处理方式对NASA公开的涡轮风扇发动机退化仿真数据集子数据集1仿真得到的结果。普通直接归一化处理方法得到的LSTM网络模型的预测结果的RMSE均值mean为13.965,std为0.520,score为341.269,std为107.875,第二种采用特征值代替原数据进行LSTM网络训练的模型预测结果RMSE均值mean为13.904,std为0.527,score为297.373,std为36.840,本文采用数据增强的方法得到的结果为RMSE均值mean为12.479,std为0.348,score为279.212,std为21.889,可以看出第一种方法和第二种方法得到的均方根误差区别不大,第二种方法得到的评分函数较第一种方法得到有效降低,其标准差也有所降低,稳定性更好一些。本文中的数据增强的方式得到的结果相较于前两种方法来说,其预测性能更加良好,均方根误差和评分函数都进一步得到下降,且展现出了良好的稳定性。
表1基于子数据集1的普通归一化方法训练的LSTM的预测结果表
RMSE | Score | |
1 | 13.192 | 327.142 |
2 | 13.263 | 234.108 |
3 | 13.814 | 261.377 |
4 | 14.474 | 604.091 |
5 | 13.955 | 428.477 |
6 | 14.52 | 312.76 |
7 | 14.477 | 307.913 |
8 | 13.82 | 251.531 |
9 | 14.665 | 274.354 |
10 | 13.469 | 344.024 |
mean | 13.965 | 341.269 |
std | 0.520 | 107.875 |
表2基于子数据集1的特征数据训练的LSTM的预测结果表
RMSE | Score | |
1 | 13.634 | 293.456 |
2 | 13.519 | 263.007 |
3 | 13.788 | 296.983 |
4 | 14.646 | 274.509 |
5 | 13.497 | 271.426 |
6 | 13.566 | 287.183 |
7 | 14.483 | 379.878 |
8 | 14.694 | 354.434 |
9 | 14.143 | 284.636 |
10 | 13.073 | 268.22 |
mean | 13.904 | 297.373 |
std | 0.527 | 36.840 |
表3基于子数据集1的本文方法的预测结果表
表4,表5和表6根据本文方法对NASA公开的涡轮风扇发动机退化仿真数据集子数据集2,3,4仿真得到的结果。
表4基于子数据集2的本文方法的预测结果表
RMSE | Score | |
1 | 17.443 | 1409.015 |
2 | 16.709 | 1308.895 |
3 | 17.076 | 1342.558 |
4 | 17.384 | 1511.902 |
5 | 17.656 | 1809.671 |
6 | 17.081 | 1292.520 |
7 | 17.041 | 1383.842 |
8 | 17.239 | 1323.760 |
9 | 17.143 | 1260.521 |
10 | 17.314 | 1587.507 |
mean | 17.209 | 1423.019 |
std | 0.248 | 160.927 |
表5基于子数据集3的本文方法的预测结果表
RMSE | Score | |
1 | 12.175 | 253.251 |
2 | 11.935 | 255.896 |
3 | 12.332 | 259.733 |
4 | 12.492 | 271.425 |
5 | 12.687 | 343.225 |
6 | 12.332 | 255.477 |
7 | 12.254 | 267.069 |
8 | 12.213 | 231.005 |
9 | 11.837 | 234.359 |
10 | 12.414 | 259.910 |
mean | 12.267 | 263.135 |
std | 0.237 | 29.308 |
表6基于子数据集4的本文方法的预测结果表
综上可见本发明提出的一种新的用于剩余寿命预测的特征增强方法是可行的,能够较为明显地提升预测性能,且预测能力较为稳定,其均方根误差和评分函数都有效得到下降,采用十次试验结果也表明这样的结果较为合理,不是网络波动产生的偶然性结果。
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (4)
1.一种用于剩余寿命预测的特征增强方法,其特征在于,包括以下步骤:
S1.对发动机传感器数据进行归一化处理,包括以下步骤:
S1.1读取涡轮风扇发动机训练集数据、测试集数据和剩余寿命数据集数据;
S1.2读取的训练集数据train_FD001和测试集数据test_FD001的传感器参数数据均为时间序列的数据,采用最大最小值归一化方法对传感器数据进行归一化处理,得到归一化后训练集数据和测试集数据;
S2.根据步骤S1得到的剩余寿命数据集和归一化处理后的训练集数据、测试集数据,计算训练集数据和测试集数据的剩余寿命RUL值,包括以下步骤:
S2.1根据训练数据集每个发动机引擎号对应的最大发动机循环数cyclemax_train,利用cyclemax_train减去发动机循环数cyclet_train,即可得到该发动机循环数下对应的剩余寿命RULt_train值;
S2.2根据测试数据集每个发动机引擎号对应的最大发动机循环数cycletest,该发动机循环数加上剩余寿命数据集中的RUL值,得到发动机最大循环数cyclemax_test,利用cyclemax_test减去发动机循环数cyclet_test,即可得到该发动机循环数下对应的剩余寿命RULt_test值;
S2.3设定最大剩余寿命RULmax值,重新计算训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,计算公式如下:
式中,RULt为训练集数据剩余寿命RULt_train值或测试集数据剩余寿命RULt_test值;
S3.对步骤S2所求出的归一化训练数据集和测试数据集进行降维处理,将传感器参数数据中参数值保持不变的传感器参数数据从数据集中剔除,让剩余的传感器参数数据作为样本原数据;
S4.根据步骤S3降维处理的训练数据集和测试数据集以及步骤S2求得的训练集数据剩余寿命RULt_train值和测试集数据剩余寿命RULt_test值,以滑动窗口的方式来提取训练数据集样本和测试数据集样本,包括以下步骤:
S4.1找到训练数据集每个发动机引擎号对应的最大发动机循环数cyclemax_train,并取出其中的最小值cyclemax_train_min,设定滑动窗口大小winSize接近且不超过此最小值cyclemax_train_min;
S4.2以滑动窗口大小为行,降维传感器参数数据为列,对训练数据集和测试数据集进行样本提取,其对应网络的输出为发动机剩余寿命,此时的训练数据集输入样本为trainX_New,测试数据集输入样本为testX_New,训练数据集输出样本为trainY,测试集数据输出样本为testY;
S5.利用手工特征提取的方式对步骤S4获取的训练集样本trainX_New和测试及样本testX_New进行数据特征增强,对每个样本增加岭回归权重、样本均值、样本最大值、样本最小值四个特征值,扩充样本维度,确定数据特征增强后的样本,包括以下步骤:
S5.1对于S4获取的训练集样本trainX_New和测试及样本testX_New,分别计算出各传感器参数的岭回归权重值coef,均值mean,最大值max和最小值min;
S5.2对于求出的四个特征值,以winSize增强的方式添加到样本中,得到最终数据特征增强的样本;定义最终的训练集样本为trainX_reNew,最终的测试集样本为testX_New,其对应的输出发动机剩余寿命RULt值不变,即trainY和testY不变;
S6.设置深度学习神经网络长短期记忆LSTM结构,加入样本进行训练,利用训练好的神经网络模型对测试数据进行预测,包括以下步骤:
S6.1建立Sequential顺序模型结构,其为网络层的线性堆栈;
S6.2添加LSTM层以及NN层,并采用激活函数函数来防止神经网络模型学习的过拟合;
S6.3选取网络的优化器optimizer,目标损失函数loss,批处理量batch_size以及训练次数epochs,将输入样本trainX_reNew和输出样本trainY添加到网络中进行训练,得到预测模型;
S6.4将训练好的预测模型对测试集testX_reNew进行预测,并结合testY进行模型预测对比,得到预测结果:均方根误差rmse和评分函数score;
所述均方根误差的计算方式为:
上式中,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue之间的误差;
所述评分函数的计算方式为:
同样,n为样本个数,hi为剩余寿命预测值RULpre和剩余寿命真实值RULtrue之间的误差。
2.根据权利要求1所述的一种用于剩余寿命预测的特征增强方法,其特征在于,所述的步骤S2.3中设定最大剩余寿命RULmax值为125。
3.根据权利要求1所述的一种用于剩余寿命预测的特征增强方法,其特征在于,所述步骤S 6.2中:LSTM层结构一般设置为3~4层神经网络结构,NN层一般设置为1~2层神经网络结构。
4.根据权利要求1所述的一种用于剩余寿命预测的特征增强方法,其特征在于,所述步骤S 6.2中的激活函数为雷诺函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011432003.4A CN112613226B (zh) | 2020-12-10 | 2020-12-10 | 一种用于剩余寿命预测的特征增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011432003.4A CN112613226B (zh) | 2020-12-10 | 2020-12-10 | 一种用于剩余寿命预测的特征增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112613226A CN112613226A (zh) | 2021-04-06 |
CN112613226B true CN112613226B (zh) | 2022-11-18 |
Family
ID=75229510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011432003.4A Active CN112613226B (zh) | 2020-12-10 | 2020-12-10 | 一种用于剩余寿命预测的特征增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112613226B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449463A (zh) * | 2021-06-09 | 2021-09-28 | 重庆锦禹云能源科技有限公司 | 一种基于lstm-dnn的设备寿命预测方法及装置 |
CN113722989B (zh) * | 2021-08-23 | 2023-04-28 | 南京航空航天大学 | 一种基于cps-dp模型的航空发动机寿命预测方法 |
CN113722833B (zh) * | 2021-09-09 | 2023-06-06 | 湖南工业大学 | 基于双通道长短时记忆网络的涡扇发动机剩余使用寿命预测方法 |
CN114186337A (zh) * | 2021-11-30 | 2022-03-15 | 大连理工大学 | 一种基于多源数据融合的压气机旋转失速预测方法 |
CN114297918B (zh) * | 2021-12-22 | 2024-08-13 | 大连理工大学 | 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法 |
CN114896865B (zh) * | 2022-04-20 | 2024-07-23 | 北京航空航天大学 | 一种面向数字孪生的自适应演化神经网络健康状态在线预测方法 |
CN114944057B (zh) * | 2022-04-21 | 2023-07-25 | 中山大学 | 一种路网交通流量数据的修复方法与系统 |
CN114971052A (zh) * | 2022-06-07 | 2022-08-30 | 南京理工大学 | 一种基于改进的hrhn的引擎剩余使用寿命预测方法 |
WO2024020960A1 (zh) * | 2022-07-28 | 2024-02-01 | 西门子股份公司 | 预测断路器的剩余使用寿命的方法、电子设备及存储介质 |
CN116401756B (zh) * | 2023-02-28 | 2024-09-17 | 沈阳航空航天大学 | 基于深度学习与数据增强的固体火箭发动机性能预测方法、预测系统、存储介质和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555230A (zh) * | 2019-07-12 | 2019-12-10 | 北京交通大学 | 基于集成gmdh框架的旋转机械剩余寿命预测方法 |
CN110807257A (zh) * | 2019-11-04 | 2020-02-18 | 中国人民解放军国防科技大学 | 航空发动机剩余寿命预测方法 |
-
2020
- 2020-12-10 CN CN202011432003.4A patent/CN112613226B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555230A (zh) * | 2019-07-12 | 2019-12-10 | 北京交通大学 | 基于集成gmdh框架的旋转机械剩余寿命预测方法 |
CN110807257A (zh) * | 2019-11-04 | 2020-02-18 | 中国人民解放军国防科技大学 | 航空发动机剩余寿命预测方法 |
Non-Patent Citations (1)
Title |
---|
基于CAE与LSTM的航空发动机剩余寿命预测;王旭等;《北京信息科技大学学报(自然科学版)》;20200815(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112613226A (zh) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112613226B (zh) | 一种用于剩余寿命预测的特征增强方法 | |
CN108805185B (zh) | 人脸识别方法、装置、存储介质及计算机设备 | |
CN108399201B (zh) | 一种基于循环神经网络的Web用户访问路径预测方法 | |
CN112149316A (zh) | 基于改进的cnn模型的航空发动机剩余寿命预测方法 | |
CN111460728B (zh) | 一种工业设备剩余寿命预测方法、装置、存储介质及设备 | |
CN110321603A (zh) | 一种用于航空发动机气路故障诊断的深度计算模型 | |
CN109101717B (zh) | 基于现实与模糊数据深度融合学习的固体火箭发动机可靠性预测方法 | |
Li et al. | Domain adaptation remaining useful life prediction method based on AdaBN-DCNN | |
CN114297918A (zh) | 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法 | |
CN110210495A (zh) | 基于并行LSTM自编码器动态特征提取的XGBoost软测量建模方法 | |
CN110807544A (zh) | 一种基于机器学习的油田剩余油饱和度分布的预测方法 | |
CN114266278A (zh) | 一种基于双重注意力网络的设备剩余使用寿命预测方法 | |
CN114169091A (zh) | 工程机械部件剩余寿命的预测模型建立方法及预测方法 | |
CN114462459A (zh) | 一种基于1dcnn-lstm网络模型的液压机故障诊断方法 | |
US20230223099A1 (en) | Predicting method of cell deconvolution based on a convolutional neural network | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 | |
CN115455764A (zh) | 一种框架结构多节点损伤诊断方法 | |
CN111079348A (zh) | 一种缓变信号检测方法和装置 | |
CN109493975B (zh) | 基于xgboost模型的慢性病复发预测方法、装置和计算机设备 | |
CN112560252A (zh) | 一种航空发动机剩余寿命预测方法 | |
Arifin et al. | Automatic essay scoring for Indonesian short answers using siamese Manhattan long short-term memory | |
CN115048873B (zh) | 一种用于飞机发动机的剩余使用寿命预测系统 | |
CN114818811B (zh) | 一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法 | |
CN116628444A (zh) | 一种基于改进元学习的水质预警方法 | |
CN113052060B (zh) | 基于数据增强的轴承剩余寿命预测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |