Nothing Special   »   [go: up one dir, main page]

CN112904810B - 基于有效特征选择的流程工业非线性过程监测方法 - Google Patents

基于有效特征选择的流程工业非线性过程监测方法 Download PDF

Info

Publication number
CN112904810B
CN112904810B CN202110044130.5A CN202110044130A CN112904810B CN 112904810 B CN112904810 B CN 112904810B CN 202110044130 A CN202110044130 A CN 202110044130A CN 112904810 B CN112904810 B CN 112904810B
Authority
CN
China
Prior art keywords
self
hidden layer
encoder
data set
online detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110044130.5A
Other languages
English (en)
Other versions
CN112904810A (zh
Inventor
袁小锋
网文聪
王雅琳
王凯
阳春华
桂卫华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202110044130.5A priority Critical patent/CN112904810B/zh
Publication of CN112904810A publication Critical patent/CN112904810A/zh
Application granted granted Critical
Publication of CN112904810B publication Critical patent/CN112904810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41865Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by job scheduling, process planning, material flow
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32252Scheduling production, machining, job shop
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供了一种基于有效特征选择的流程工业非线性过程监测方法,包括:步骤1,获取流程工业正常运行时的过程变量,根据获取的过程变量构建正常数据集,并对正常数据集进行数据预处理;步骤2,将预处理后的正常数据样本输入预先设置的堆叠自编码器模型,提取预处理后的正常数据样本的隐藏层特征,并预训练多个自编码器,将预训练后的多个自编码器的输入层和隐藏层依次连接和堆叠,构建训练后的堆叠自编码器模型,对训练后的堆叠自编码器模型的参数进行微调,得到训练后的堆叠自编码器模型的超参数。本发明通过有效特征选择策略对提取的隐藏层特征做选择,选取对故障监测更有效的特征,大幅提高了故障监测的准确率,极大地提高了故障监测效果。

Description

基于有效特征选择的流程工业非线性过程监测方法
技术领域
本发明涉及流程工业技术领域,特别涉及一种基于有效特征选择的流程工业非线性过程监测方法。
背景技术
流程工业指生产制造流程性产品的现代制造业,主要处理以连续和间歇物料流、能量流为主的产品。其产品加工方法主要有化学和物理反应、分离、混合等,近几十年,流程工业一直是我国国民经济和社会发展的支柱性产业。随着生产能力与科学技术的发展,中国的流程工业也有了长足的提升和进步。如今,工业生产过程面临新的形势和新的问题,自动化、信息化、智能化已成为工业生产过程转型升级、安全生产、节能减排的发展方向。因此,系统的能力和现代化水平日益提高,工业规模迅速扩大,对于大型生产系统来说,系统异常的出现可能会导致生产损失、作业单元损坏,甚至造成人员伤亡。为了保证工业系统的正常运行和产品质量,确保人员和财产的安全,需要实时识别异常工况的存在并及时给与操作恢复生产状况,即对工业生产过程在线监测。
目前,计算机技术与分布式控制系统在流程工业广泛应用,使得大量的过程变量数据也能被收集和利用,然而许多产品生产过程的故障事件仍由操作人员人工处理。由于操作人员自身经验及能力的不足,在面对生产异常状况时,难免采用错误的应对方式,导致工业生产不能平稳的运行。因此,本研究的重点内容是引入计算机控制系统对流程工业生产过程进行实时且准确的监控,在应对生产故障时对现场操作人员进行指导与协助。
近年来,工业数据的采集更加方便快捷,在诸多过程监控的研究方法中,大多使用定性分析方法与定量分析方法实施工业过程的实时监控。定性分析方法是通过分析系统变量或参数之间的关系来描述一个系统的状态,常见的方法有:专家系统方法、图论方法和与定性仿真方法。定量分析法是使用数学模块对工业数据的数量特征、数量关系及数量变化进行分析的方法,从而揭示和描述过程变量间的相关关系和发展趋势。通常情况下,定量分析方法分为基于解析模型的方法和数据驱动的方法。
基于解析模型的过程监控方法研究较早。此类方法包含了对系统内部的隐层认识,但是它只适用于被监控对象拥有精确的数学模型,且建模过程复杂,而实际中,工业过程的精确数学模型往往难以得到,此时该方法便不能得到满意的监控效果。目前,在现代工业工厂中,不同的操作单元可测量大量反映工业过程操作状态的变量,从而给基于数据驱动的方法提供了契机。基于数据驱动的过程监控是一种有效的技术,它可以从现代过程系统中随时可用的过程数据中提取信息,从而在不需要知道系统精确解析模型的情况下更好地了解过程。由于这种数据驱动的性质,数据驱动的监测方法非常适合于复杂和大规模的流程系统。数据驱动方法使用历史数据来建立流程监控模型,进而得出故障检测的监控指标。
然而,基于数据驱动的过程监测也存在以下问题。模型提取的有效特征信息不充分,如何去除冗余信息,提取到关键信息也是提高系统监测性能的一个重要方面。但是现有的过程监控的特征提取方法无法从这些高度非线性且动态变化的数据中提取关键的有效特征,影响了监控的性能。而堆栈自编码器作为一种提取特征的方法,通过非线性映射训练多个自编码器网络,将高维数据转换为低维特征,能够获得输入数据的抽象关键特征并提取到变量的非线性关系。
发明内容
本发明提供了一种基于有效特征选择的流程工业非线性过程监测方法,其目的是为了解决传统的自编码器模型仅仅关注于尽可能重构原始输入的特征提取,忽略了从故障检测的角度提取增大故障数据与正常数据区别的特征信息的问题。
为了达到上述目的,本发明的实施例提供了一种基于有效特征选择的流程工业非线性过程监测方法,包括:
步骤1,获取流程工业正常运行时的过程变量,根据获取的过程变量构建正常数据集,并对正常数据集进行数据预处理;
步骤2,将预处理后的正常数据样本输入预先设置的堆叠自编码器模型,提取预处理后的正常数据样本的隐藏层特征,并预训练多个自编码器,将预训练后的多个自编码器的输入层和隐藏层依次连接和堆叠,构建训练后的堆叠自编码器模型,对训练后的堆叠自编码器模型的参数进行微调,得到训练后的堆叠自编码器模型的超参数;
步骤3,通过有效特征选择策略选择出预处理后的正常数据样本隐藏层特征中的有效特征,根据选择出的正常数据样本隐藏层特征的有效特征计算正常数据集中样本的统计量,并通过核密度估计计算统计量的控制限;
步骤4,获取流程工业运行过程中的实时过程变量,根据获取的实时过程变量构建在线检测数据集,并对在线检测数据集进行数据预处理;
步骤5,将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取预处理后的在线检测数据样本的隐藏层特征,通过有效特征选择策略选择隐藏层特征中的有效特征,根据选择出的隐藏层特征的有效特征计算在线检测数据集中样本的统计量;
步骤6,将在线检测数据集中各个样本的统计量与统计量的控制限进行比较,判断在线检测数据集中各个样本的统计量是否超过统计量的控制限,当在线检测数据集中某一在线检测数据样本的统计量超过统计量的控制限时,进行报警提示,且将当前在线检测数据样本判断为故障的在线检测数据样本,并记录判断为故障的在线检测数据样本的个数,当在线检测数据集中某一在线检测数据样本的统计量未超过统计量的控制限时,将当前在线检测数据样本判断为正常的在线检测数据样本,根据在线检测数据集中的故障数据样本的个数和在线检测数据集中判断为故障的在线检测数据样本的个数计算故障检测率。
其中,所述步骤1具体包括:
基于正常流程工业按一定时间顺序采集过程变量,根据采集的过程变量构建正常数据集,正常数据集表示为X1=[x1,x2,...,xn]T∈Rn×m,其中,n表示正常数据集数,m表示过程变量个数;
对正常数据集X1=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure BDA0002896914880000031
其中,i表示正常数据样本,i=1,2,...,n,
Figure BDA0002896914880000032
表示第i个正常数据样本的第m个过程变量,
Figure BDA0002896914880000041
表示正常数据样本中的第m个过程变量中的最大值,
Figure BDA0002896914880000042
表示正常数据样本中的第m个过程变量中的最小值。
其中,所述步骤2具体包括:
将预处理后的正常数据集输入预先设置的堆叠自编码器模型的首个自编码器进行模型训练,自编码器与解码器的结构,如下所示:
hi=f(xi;θ1)=f(W1xi+b1),θ1={W1,b1} (2)
ri=g(hi;θ2)=g(W2hi+b2),θ2={W2,b2} (3)
其中,h=f(x)表示隐藏层的激活函数,r=g(h)表示输出层的激活函数;θ1表示隐藏层的参数集合,θ2表示输出层的参数集合,k表示隐藏层结点的个数,xi∈Rm表示第i个正常数据样本,hi∈Rk表示经过自编码器提取的隐藏层特征,g(·)表示解码函数,ri∈Rm表示输出向量,W1表示编码器的权重,W1∈Rk×m,W2表示解码器的权重,W2∈Rm×k,b1表示编码器的偏置参数,b1∈Rk,b2表示解码器的偏置参数,b2∈Rm
其中,所述步骤2还包括:
将正常数据集输入预先设置的堆叠自编码器模型的首个自编码器,通过首个自编码器提取隐藏层特征;
将提取的隐藏层特征输入后一个自编码器,通过后一个自编码器提取隐藏层特征;
重复执行将前一个自编码器提取的隐藏层特征数据输入后一个自编码器,通过后一个自编码器提取隐藏层特征,直到无后一个自编码器停止,获得各个自编码器的权重、各个自编码器的偏置参数和各个自编码器的隐藏层特征;
将预训练完成后的各个自编码器按照输入层和隐藏层依次连接起来,构建训练后的堆叠自编码器模型;
通过反向传播算法对训练后的堆叠自编码器模型的参数进行全局微调。
其中,所述步骤3具体包括:
通过有效特征选择策略对堆叠自编码器最终提取的隐藏层的特征进行有效特征提取,在特征空间构建的统计量T2,如下所示:
Figure BDA0002896914880000043
根据式(4)定义正常数据集隐藏层的每个特征的贡献度的计算公式并计算正常数据集隐藏层各个特征的贡献度,如下所示:
Figure BDA0002896914880000051
其中,cj表示正常数据集隐藏层第j个特征的贡献度,f表示自编码器激活函数,X1表示正常数据集,w1j表示正常数据集隐藏层第j个特征的自编码器权重,
Figure BDA0002896914880000052
表示正常数据集隐藏层第j个特征的偏置参数,
Figure BDA0002896914880000053
表示正常数据集提取的隐藏层中第j个特征的均值,σ1j 2表示正常数据集提取的隐藏层中第j个特征的方差。
其中,所述步骤3还包括:
将计算出的隐藏层各个特征的贡献度进行降序排列,选取贡献度最大的d个特征,训练后的堆叠自编码器模型的超参数d满足以下条件,如下所示:
C(d)≥C* (6)
其中,C*表示预先设定的阈值,C*设定为80%到90%之间;
假设第l个自编码器的隐藏层有y个特征,则y个特征的贡献度降序排列为c1≥c2≥...≥cy,得出满足式(6)条件的最小训练后的堆叠自编码器模型的超参数d,如下所示:
Figure BDA0002896914880000054
其中,d表示训练后的堆叠自编码器模型的超参数,1≤d≤y,y表示特征个数,k表示第k个隐藏层特征,ck表示第k个隐藏层特征的贡献度;
计算正常数据集中样本的统计量,如下所示:
Figure BDA0002896914880000055
其中,T1 2表示正常数据集中样本的统计量,H1j表示正常数据集提取的隐藏层中第j个特征的值。
其中,所述步骤3还包括:
通过核密度估计计算统计量的控制限,如下所示:
Figure BDA0002896914880000061
其中,p(x)表示正常数据集X1的概率分布函数,X1i表示正常数据集的第i个正常数据样本,n表示正常数据样本个数,h表示带宽参数,K(·)表示核函数;
核函数K(·)满足以下条件:
Figure BDA0002896914880000062
K(x)≥0 (11)。
其中,所述步骤4具体包括:
获取流程工业中实时的过程变量,根据获取的实时过程变量构建在线检测数据集,在线检测数据集表示为X2=[x1,x2,...,xn]T∈Rn×m,在线检测数据集中包括正常在线检测数据样本和故障数据样本,对在线检测数据集X2=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure BDA0002896914880000063
其中,θ表示在线检测数据样本,θ=1,2,...,n,
Figure BDA0002896914880000064
表示第θ个在线检测数据样本的第m个过程变量。
其中,所述步骤5具体包括:
将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取在线检测数据样本隐藏层的特征,通过有效特征选择策略选择在线检测数据样本隐藏层的特征的有效特征,根据选择出的在线检测数据样本隐藏层特征的有效特征计算在线检测数据集中样本的统计量,如下所示:
Figure BDA0002896914880000065
其中,T2 2表示在线检测数据集中样本的统计量,H2j表示在线检测数据集提取的隐藏层中第j个特征的值。
其中,所述步骤6具体包括:
计算故障检测率,如下所示:
Figure BDA0002896914880000066
其中,fdr表示故障检测率,a表示在线检测数据集中被判断为故障的在线检测数据样本的个数,s表示在线检测数据集中故障数据样本的个数。
本发明的上述方案有如下的有益效果:
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,通过有效特征选择策略对提取的原始特征做选择,选取对故障监测更有效的特征,大幅提高了故障监测的准确率,极大地提高了故障监测效果。
附图说明
图1为本发明的流程图;
图2为本发明的TE过程示意图;
图3为本发明在特征空间的故障检测率对比示意图;
图4为本发明在残差空间的故障检测率对比示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的自编码器模型仅仅关注于尽可能重构原始输入的特征提取,忽略了从故障检测的角度提取增大故障数据与正常数据区别的特征信息的问题,提供了一种基于有效特征选择的流程工业非线性过程监测方法。
如图1至图4所示,本发明的实施例提供了一种基于有效特征选择的流程工业非线性过程监测方法,包括:步骤1,获取流程工业正常运行时的过程变量,根据获取的过程变量构建正常数据集,并对正常数据集进行数据预处理;步骤2,将预处理后的正常数据样本输入预先设置的堆叠自编码器模型,提取预处理后的正常数据样本的隐藏层特征,并预训练多个自编码器,将预训练后的多个自编码器的输入层和隐藏层依次连接和堆叠,构建训练后的堆叠自编码器模型,对训练后的堆叠自编码器模型的参数进行微调,得到训练后的堆叠自编码器模型的超参数;步骤3,通过有效特征选择策略选择出预处理后的正常数据样本隐藏层特征中的有效特征,根据选择出的正常数据样本隐藏层特征的有效特征计算正常数据集中样本的统计量,并通过核密度估计计算统计量的控制限;步骤4,获取流程工业运行过程中的实时过程变量,根据获取的实时过程变量构建在线检测数据集,并对在线检测数据集进行数据预处理;步骤5,将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取预处理后的在线检测数据样本的隐藏层特征,通过有效特征选择策略选择隐藏层特征中的有效特征,根据选择出的隐藏层特征的有效特征计算在线检测数据集中样本的统计量;步骤6,将在线检测数据集中各个样本的统计量与统计量的控制限进行比较,判断在线检测数据集中各个样本的统计量是否超过统计量的控制限,当在线检测数据集中某一在线检测数据样本的统计量超过统计量的控制限时,进行报警提示,且将当前在线检测数据样本判断为故障的在线检测数据样本,并记录判断为故障的在线检测数据样本的个数,当在线检测数据集中某一在线检测数据样本的统计量未超过统计量的控制限时,将当前在线检测数据样本判断为正常的在线检测数据样本,根据在线检测数据集中的故障数据样本的个数和在线检测数据集中判断为故障的在线检测数据样本的个数计算故障检测率。
其中,所述步骤1具体包括:基于正常流程工业按一定时间顺序采集过程变量,根据采集的过程变量构建正常数据集,正常数据集表示为X1=[x1,x2,...,xn]T∈Rn×m,其中,n表示正常数据集数,m表示过程变量个数;
对正常数据集X1=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure BDA0002896914880000081
其中,i表示正常数据样本,i=1,2,...,n,
Figure BDA0002896914880000082
表示第i个正常数据样本的第m个过程变量,
Figure BDA0002896914880000083
表示正常数据样本中的第m个过程变量中的最大值,
Figure BDA0002896914880000084
表示正常数据样本中的第m个过程变量中的最小值。
其中,所述步骤2具体包括:将预处理后的正常数据集输入预先设置的堆叠自编码器模型的首个自编码器进行模型训练,自编码器与解码器的结构,如下所示:
hi=f(xi;θ1)=f(W1xi+b1),θ1={W1,b1} (2)
ri=g(hi;θ2)=g(W2hi+b2),θ2={W2,b2} (3)
其中,h=f(x)表示隐藏层的激活函数,r=g(h)表示输出层的激活函数;θ1表示隐藏层的参数集合,θ2表示输出层的参数集合,k表示隐藏层结点的个数,xi∈Rm表示第i个正常数据样本,hi∈Rk表示经过自编码器提取的隐藏层特征,g(·)表示解码函数,ri∈Rm表示输出向量,W1表示编码器的权重,W1∈Rk×m,W2表示解码器的权重,W2∈Rm×k,b1表示编码器的偏置参数,b1∈Rk,b2表示解码器的偏置参数,b2∈Rm
其中,所述步骤2还包括:将正常数据集输入预先设置的堆叠自编码器模型的首个自编码器,通过首个自编码器提取隐藏层特征;将提取的隐藏层特征输入后一个自编码器,通过后一个自编码器提取隐藏层特征;重复执行将前一个自编码器提取的隐藏层特征数据输入后一个自编码器,通过后一个自编码器提取隐藏层特征,直到无后一个自编码器停止,获得各个自编码器的权重、各个自编码器的偏置参数和各个自编码器的隐藏层特征;将预训练完成后的各个自编码器按照输入层和隐藏层依次连接起来,构建训练后的堆叠自编码器模型;通过反向传播算法对训练后的堆叠自编码器模型的参数进行全局微调。
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,自编码器的原理是通过网络隐层的学习在输出部分对输入进行重构,即让ri逼近xi,之后通过反向传播算法,利用二者之间的误差反向传播训练即得到一个预训练完成的自编码器,对于l-1自编码器的训练,将第l-1隐藏层特征作为第l个自编码器的输入,获得第l个自编码器的权重和偏置参数,并提取第l隐藏层特征,激活函数可以是sigmoid,tanh双曲正切函数或者ReLu线性整流函数。
其中,所述步骤3具体包括:通过有效特征选择策略对堆叠自编码器最终提取的隐藏层的特征进行有效特征提取,在特征空间构建的统计量T2,如下所示:
Figure BDA0002896914880000093
根据式(4)定义正常数据集隐藏层的每个特征的贡献度的计算公式并计算正常数据集隐藏层各个特征的贡献度,如下所示:
Figure BDA0002896914880000091
其中,cj表示正常数据集隐藏层第j个特征的贡献度,f表示自编码器激活函数,X1表示正常数据集,
Figure BDA0002896914880000092
表示正常数据集隐藏层第j个特征的自编码器权重,
Figure BDA0002896914880000105
表示正常数据集隐藏层第j个特征的偏置参数,
Figure BDA0002896914880000101
表示正常数据集提取的隐藏层中第j个特征的均值,σ1j 2表示正常数据集提取的隐藏层中第j个特征的方差。
其中,所述步骤3还包括:将计算出的隐藏层各个特征的贡献度进行降序排列,选取贡献度最大的d个特征,训练后的堆叠自编码器模型的超参数d满足以下条件,如下所示:
C(d)≥C* (6)
其中,C*表示预先设定的阈值,C*设定为80%到90%之间;
假设第l个自编码器的隐藏层有y个特征,则y个特征的贡献度降序排列为c1≥c2≥...≥cy,得出满足式(6)条件的最小训练后的堆叠自编码器模型的超参数d,如下所示:
Figure BDA0002896914880000102
其中,d表示训练后的堆叠自编码器模型的超参数,1≤d≤y,y表示特征个数,k表示第k个隐藏层特征,ck表示第k个隐藏层特征的贡献度;
计算正常数据集中样本的统计量,如下所示:
Figure BDA0002896914880000103
其中,T1 2表示正常数据集中样本的统计量,H1j表示正常数据集提取的隐藏层中第j个特征的值。
其中,所述步骤3还包括:通过核密度估计计算统计量的控制限,如下所示:
Figure BDA0002896914880000104
其中,p(x)表示正常数据集X1的概率分布函数,X1i表示正常数据集的第i个正常数据样本,n表示正常数据样本个数,h表示带宽参数,K(·)表示核函数;
核函数K(·)满足以下条件:
Figure BDA0002896914880000111
K(x)≥0 (11)。
其中,所述步骤4具体包括:获取流程工业中实时的过程变量,根据获取的实时过程变量构建在线检测数据集,在线检测数据集表示为X2=[x1,x2,...,xn]T∈Rn×m,在线检测数据集中包括正常在线检测数据样本和故障数据样本,对在线检测数据集X2=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure BDA0002896914880000112
其中,θ表示在线检测数据样本,θ=1,2,...,n,
Figure BDA0002896914880000113
表示第θ个在线检测数据样本的第m个过程变量。
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,通过在线检测数据集验证训练后的堆叠自编码模型的预测性能。
其中,所述步骤5具体包括:将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取在线检测数据样本隐藏层的特征,通过有效特征选择策略选择在线检测数据样本隐藏层的特征的有效特征,根据选择出的在线检测数据样本隐藏层特征的有效特征计算在线检测数据集中样本的统计量,如下所示:
Figure BDA0002896914880000114
其中,T2 2表示在线检测数据集中样本的统计量,H2j表示在线检测数据集提取的隐藏层中第j个特征的值。
其中,所述步骤6具体包括:计算故障检测率,如下所示:
Figure BDA0002896914880000115
其中,fdr表示故障检测率,a表示在线检测数据集中被判断为故障的在线检测数据样本的个数,s表示在线检测数据集中故障数据样本的个数。
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,堆叠自编码器模型的训练过程分为逐层预训练和反向微调两个步骤,首先逐层预训练每个自编码器,输入正常数据集经过第一个自编码器,提取第一隐藏层特征数据;将第一隐藏层特征数据作为第二个自编码器的输入,提取第二隐藏层特征数据;重复将前一个自编码器的隐藏层特征数据作为后一个自编码器的隐藏层特征数据的输入,并提取后一个自编码器的隐藏层特征数据的步骤,l表示自编码器在堆叠自编码器模型中的位置,l=1,2,…,n;对于后续自编码器(即l>=2时)的训练,将l-1隐藏层特征数据作为第l个自编码器的输入,进而获得第l个自编码器的权重及偏置参数,并提取第l隐藏层特征数据;将预训练后的l个自编码器按照输入层和隐藏层依次连接起来,形成一个堆叠自编码器模型,在预训练获得的参数基础上,最后利用反向传播做全局微调,训练后堆叠自编码器模型。在反向微调步骤中,利用反向传播算法,通过构造堆叠自编码器模型的损失函数来微调堆叠自编码器模型的参数,直至网络收敛到目标范围。
在本实施例中将本发明应用到流程工业TE过程的过程监测中,具体方法步骤包括:TE过程(Tennessee Eastman,TE,田纳西-伊斯曼)的控制结构包含五个主要的操作单元,反应器,冷凝器,分离器,压缩器,剥离器。包含22个测量变量,19个成分变量,12个操作变量,选取11个操作变量和22个连续变量用于过程监测,该TE过程共有21个故障数据集当作测试集,每个数据集包含960个样本,从第161个样本开始引入故障,正常数据集有500个样本,为TE过程采集的正常数据,堆叠自编码器模型为33->30->27->30->33,即输入维度为33,自编码器个数为2。两个自编码器的输入层到隐藏层的各参数分别为{w1、w2、b1、b2},两个自编码器的隐层激活函数分别为{g1、g2}。
如表1所示,为主元分析(Principal component analysis,PCA)、堆叠自编码器(StackAutoEncoder,SAE)、有效特征选择的堆叠自编码器(SAE-Characteristicselection,SAE-CS)这三种模型在测试集21中故障上的特征空间和残差空间故障检测率。
表1三种模型在TE过程上的故障检测率
Figure BDA0002896914880000121
Figure BDA0002896914880000131
由表中可看出有效特征选择的堆叠自编码器的故障检测率在TE数据集的21类故障中表现很好,无论是特征空间,还是残差空间,有效特征选择的堆叠自编码器的检测率都普遍比原始堆叠自编码器的检测率效果好,有效特征选择的堆叠自编码器具有更高的准确性。
表2TE过程故障类别
Figure BDA0002896914880000132
Figure BDA0002896914880000141
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,获取流程工业正常运行时的过程变量,构成正常数据集,将正常数据集输入原先设定好由l个自编码器依次堆叠而成的堆叠自编码器模型,l=1,2...,n,得到多个隐藏层特征,训练堆叠自编码器模型,得到训练后的堆叠自编码器模型,在堆叠自编码器模型中通过有效特征选择策略从故障检测的角度,选取多个隐藏层特征中更能区分故障样本与正常样本的有效特征,根据选取的有效特征计算正常数据集中样本的统计量,通过核密度估计计算正常数据集中样本控制量的控制限;获取流程工业中实时的过程变量,根据实时过程变量构建在线检测数据集,并对在线检测数据集进行数据预处理,将预处理后的在线检测数据集输入训练后的堆叠自编码器进行隐藏层特征提取,通过有效特征选择策略选择隐藏层特征中的有效特征,根据选择出的隐藏层特征的有效特征计算在线检测数据集中样本的统计量,将在线检测数据集中各个样本的统计量与正常数据集的控制限相比较,判断当前在线检测数据样本是否为故障的在线检测数据样本,并记录被判断为故障的在线检测数据样本的个数,根据在线检测数据集的中故障数据样本的个数和被判断为故障的在线检测数据样本的个数计算故障检测率,通过故障检测率判断训练后的堆叠自编码器模型的预测性能。
本发明的上述实施例所述的基于有效特征选择的流程工业非线性过程监测方法,通过有效特征选择策略对提取的隐藏层特征做选择,选取对故障监测更有效的特征,能自适应地选择提高故障检测率的有效特征,极大地提高了堆叠自编码器模型的监测效果,大幅提高了故障监测的准确率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于有效特征选择的流程工业非线性过程监测方法,其特征在于,包括:
步骤1,获取流程工业正常运行时的过程变量,根据获取的过程变量构建正常数据集,并对正常数据集进行数据预处理;
步骤2,将预处理后的正常数据样本输入预先设置的堆叠自编码器模型,提取预处理后的正常数据样本的隐藏层特征,并预训练多个自编码器,将预训练后的多个自编码器的输入层和隐藏层依次连接和堆叠,构建训练后的堆叠自编码器模型,对训练后的堆叠自编码器模型的参数进行微调,得到训练后的堆叠自编码器模型的超参数;
步骤3,通过有效特征选择策略选择出预处理后的正常数据样本隐藏层特征中的有效特征,根据选择出的正常数据样本隐藏层特征的有效特征计算正常数据集中样本的统计量,并通过核密度估计计算统计量的控制限;
步骤4,获取流程工业运行过程中的实时过程变量,根据获取的实时过程变量构建在线检测数据集,并对在线检测数据集进行数据预处理;
步骤5,将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取预处理后的在线检测数据样本的隐藏层特征,通过有效特征选择策略选择隐藏层特征中的有效特征,根据选择出的隐藏层特征的有效特征计算在线检测数据集中样本的统计量;
步骤6,将在线检测数据集中各个样本的统计量与统计量的控制限进行比较,判断在线检测数据集中各个样本的统计量是否超过统计量的控制限,当在线检测数据集中某一在线检测数据样本的统计量超过统计量的控制限时,进行报警提示,且将当前在线检测数据样本判断为故障的在线检测数据样本,并记录判断为故障的在线检测数据样本的个数,当在线检测数据集中某一在线检测数据样本的统计量未超过统计量的控制限时,将当前在线检测数据样本判断为正常的在线检测数据样本,根据在线检测数据集中的故障数据样本的个数和在线检测数据集中判断为故障的在线检测数据样本的个数计算故障检测率。
2.根据权利要求1所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤1具体包括:
基于正常流程工业按一定时间顺序采集过程变量,根据采集的过程变量构建正常数据集,正常数据集表示为X1=[x1,x2,...,xn]T∈Rn×m,其中,n表示正常数据集数,m表示过程变量个数;
对正常数据集X1=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure FDA0002896914870000021
其中,i表示正常数据样本,i=1,2,...,n,
Figure FDA0002896914870000022
表示第i个正常数据样本的第m个过程变量,
Figure FDA0002896914870000023
表示正常数据样本中的第m个过程变量中的最大值,
Figure FDA0002896914870000024
表示正常数据样本中的第m个过程变量中的最小值。
3.根据权利要求2所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤2具体包括:
将预处理后的正常数据集输入预先设置的堆叠自编码器模型的首个自编码器进行模型训练,自编码器与解码器的结构,如下所示:
hi=f(xi;θ1)=f(W1xi+b1),θ1={W1,b1} (2)
ri=g(hi;θ2)=g(W2hi+b2),θ2={W2,b2} (3)
其中,h=f(x)表示隐藏层的激活函数,r=g(h)表示输出层的激活函数;θ1表示隐藏层的参数集合,θ2表示输出层的参数集合,k表示隐藏层结点的个数,xi∈Rm表示第i个正常数据样本,hi∈Rk表示经过自编码器提取的隐藏层特征,g(·)表示解码函数,ri∈Rm表示输出向量,W1表示编码器的权重,W1∈Rk×m,W2表示解码器的权重,W2∈Rm×k,b1表示编码器的偏置参数,b1∈Rk,b2表示解码器的偏置参数,b2∈Rm
4.根据权利要求3所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤2还包括:
将正常数据集输入预先设置的堆叠自编码器模型的首个自编码器,通过首个自编码器提取隐藏层特征;
将提取的隐藏层特征输入后一个自编码器,通过后一个自编码器提取隐藏层特征;
重复执行将前一个自编码器提取的隐藏层特征数据输入后一个自编码器,通过后一个自编码器提取隐藏层特征,直到无后一个自编码器停止,获得各个自编码器的权重、各个自编码器的偏置参数和各个自编码器的隐藏层特征;
将预训练完成后的各个自编码器按照输入层和隐藏层依次连接起来,构建训练后的堆叠自编码器模型;
通过反向传播算法对训练后的堆叠自编码器模型的参数进行全局微调。
5.根据权利要求4所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤3具体包括:
通过有效特征选择策略对堆叠自编码器最终提取的隐藏层的特征进行有效特征提取,在特征空间构建的统计量T2,如下所示:
Figure FDA0002896914870000031
根据式(4)定义正常数据集隐藏层的每个特征的贡献度的计算公式并计算正常数据集隐藏层各个特征的贡献度,如下所示:
Figure FDA0002896914870000032
其中,cj表示正常数据集隐藏层第j个特征的贡献度,f表示自编码器激活函数,X1表示正常数据集,
Figure FDA0002896914870000033
表示正常数据集隐藏层第j个特征的自编码器权重,
Figure FDA0002896914870000034
表示正常数据集隐藏层第j个特征的偏置参数,
Figure FDA0002896914870000035
表示正常数据集提取的隐藏层中第j个特征的均值,
Figure FDA0002896914870000036
表示正常数据集提取的隐藏层中第j个特征的方差。
6.根据权利要求5所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤3还包括:
将计算出的隐藏层各个特征的贡献度进行降序排列,选取贡献度最大的d个特征,训练后的堆叠自编码器模型的超参数d满足以下条件,如下所示:
C(d)≥C* (6)
其中,C*表示预先设定的阈值,C*设定为80%到90%之间;
假设第l个自编码器的隐藏层有y个特征,则y个特征的贡献度降序排列为c1≥c2≥...≥cy,得出满足式(6)条件的最小训练后的堆叠自编码器模型的超参数d,如下所示:
Figure FDA0002896914870000041
其中,d表示训练后的堆叠自编码器模型的超参数,1≤d≤y,y表示特征个数,k表示第k个隐藏层特征,ck表示第k个隐藏层特征的贡献度;
计算正常数据集中样本的统计量,如下所示:
Figure FDA0002896914870000042
其中,T1 2表示正常数据集中样本的统计量,
Figure FDA0002896914870000043
表示正常数据集提取的隐藏层中第j个特征的值。
7.根据权利要求6所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤3还包括:
通过核密度估计计算统计量的控制限,如下所示:
Figure FDA0002896914870000044
其中,p(x)表示正常数据集X1的概率分布函数,X1i表示正常数据集的第i个正常数据样本,n表示正常数据样本个数,h表示带宽参数,K(·)表示核函数;
核函数K(·)满足以下条件:
Figure FDA0002896914870000045
K(x)≥0 (11)。
8.根据权利要求7所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤4具体包括:
获取流程工业中实时的过程变量,根据获取的实时过程变量构建在线检测数据集,在线检测数据集表示为X2=[x1,x2,...,xn]T∈Rn×m,在线检测数据集中包括正常在线检测数据样本和故障数据样本,对在线检测数据集X2=[x1,x2,...,xn]T∈Rn×m进行数据预处理,如下所示:
Figure FDA0002896914870000046
其中,θ表示在线检测数据样本,θ=1,2,...,n,
Figure FDA0002896914870000051
表示第θ个在线检测数据样本的第m个过程变量。
9.根据权利要求8所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤5具体包括:
将预处理后的在线检测数据样本输入训练后的堆叠自编码器模型,提取在线检测数据样本隐藏层的特征,通过有效特征选择策略选择在线检测数据样本隐藏层的特征的有效特征,根据选择出的在线检测数据样本隐藏层特征的有效特征计算在线检测数据集中样本的统计量,如下所示:
Figure FDA0002896914870000052
其中,T2 2表示在线检测数据集中样本的统计量,
Figure FDA0002896914870000053
表示在线检测数据集提取的隐藏层中第j个特征的值。
10.根据权利要求9所述的基于有效特征选择的流程工业非线性过程监测方法,其特征在于,所述步骤6具体包括:
计算故障检测率,如下所示:
Figure FDA0002896914870000054
其中,fdr表示故障检测率,a表示在线检测数据集中被判断为故障的在线检测数据样本的个数,s表示在线检测数据集中故障数据样本的个数。
CN202110044130.5A 2021-01-13 2021-01-13 基于有效特征选择的流程工业非线性过程监测方法 Active CN112904810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110044130.5A CN112904810B (zh) 2021-01-13 2021-01-13 基于有效特征选择的流程工业非线性过程监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110044130.5A CN112904810B (zh) 2021-01-13 2021-01-13 基于有效特征选择的流程工业非线性过程监测方法

Publications (2)

Publication Number Publication Date
CN112904810A CN112904810A (zh) 2021-06-04
CN112904810B true CN112904810B (zh) 2022-07-01

Family

ID=76112879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110044130.5A Active CN112904810B (zh) 2021-01-13 2021-01-13 基于有效特征选择的流程工业非线性过程监测方法

Country Status (1)

Country Link
CN (1) CN112904810B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468537B (zh) * 2021-06-15 2024-04-09 江苏大学 一种基于改进自编码器的特征提取及漏洞利用攻击检测方法
CN114004346B (zh) * 2021-08-17 2024-09-06 中国地质大学(武汉) 基于门控堆叠同构自编码器的软测量建模方法及存储介质
CN114167729B (zh) * 2021-12-08 2024-05-28 北京工业大学 基于分布式二段自适应加权堆叠自动编码器的微小故障检测方法及系统
CN115877223B (zh) * 2023-03-03 2023-07-04 浙江天能新材料有限公司 锂电池检测方法、装置、设备及存储介质
CN116754016B (zh) * 2023-06-25 2024-05-28 北京华控智加科技有限公司 故障检测方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978079A (zh) * 2019-04-10 2019-07-05 东北电力大学 一种改进的堆栈降噪自编码器的数据清洗方法
CN110096810A (zh) * 2019-05-05 2019-08-06 中南大学 一种基于逐层数据扩充深度学习的工业过程软测量方法
CN111324110A (zh) * 2020-03-20 2020-06-23 北京工业大学 一种基于多块收缩自动编码器的发酵过程故障监测方法
CN112034793A (zh) * 2020-08-10 2020-12-04 华东理工大学 Pta工艺流程中氧化工段生产运行状态空间监测方法
CN112101445A (zh) * 2020-09-09 2020-12-18 浙江大学 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844558B2 (en) * 2006-10-05 2010-11-30 Siemens Corporation Incremental learning of nonlinear regression networks for machine condition monitoring
CN108227653B (zh) * 2017-12-28 2021-02-05 湖州师范学院 一种基于随机化核主元分析的大规模非线性过程监控方法
WO2020055555A1 (en) * 2018-09-12 2020-03-19 Applied Materials, Inc. Deep auto-encoder for equipment health monitoring and fault detection in semiconductor and display process equipment tools

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978079A (zh) * 2019-04-10 2019-07-05 东北电力大学 一种改进的堆栈降噪自编码器的数据清洗方法
CN110096810A (zh) * 2019-05-05 2019-08-06 中南大学 一种基于逐层数据扩充深度学习的工业过程软测量方法
CN111324110A (zh) * 2020-03-20 2020-06-23 北京工业大学 一种基于多块收缩自动编码器的发酵过程故障监测方法
CN112034793A (zh) * 2020-08-10 2020-12-04 华东理工大学 Pta工艺流程中氧化工段生产运行状态空间监测方法
CN112101445A (zh) * 2020-09-09 2020-12-18 浙江大学 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法

Also Published As

Publication number Publication date
CN112904810A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
Jang et al. Adversarial autoencoder based feature learning for fault detection in industrial processes
CN109146246B (zh) 一种基于自动编码器和贝叶斯网络的故障检测方法
CN113642754B (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
Tian et al. Identification of abnormal conditions in high-dimensional chemical process based on feature selection and deep learning
CN104699077B (zh) 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法
CN108875772B (zh) 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法
CN105700518A (zh) 一种工业过程故障诊断方法
CN112000081B (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
CN111914897A (zh) 一种基于孪生长短时间记忆网络的故障诊断方法
CN111340110B (zh) 一种基于工业过程运行状态趋势分析的故障预警方法
CN105607631B (zh) 间歇过程弱故障模型控制限建立方法及弱故障监测方法
CN109298633A (zh) 基于自适应分块非负矩阵分解的化工生产过程故障监测方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN111414943B (zh) 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN112947649B (zh) 一种基于互信息矩阵投影的多变量过程监控方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
Wang et al. An Entropy-and Attention-Based Feature Extraction and Selection Network for Multi-Target Coupling Scenarios
CN117150337A (zh) 基于分诊制的化工过程故障诊断方法
CN113253682B (zh) 非线性化工过程故障检测方法
CN116522993A (zh) 一种基于对抗自编码网络的化工过程故障检测方法
CN110674461B (zh) 基于多块投影非负矩阵分解的化工生产过程监控方法
CN115017978A (zh) 一种基于加权概率神经网络的故障分类方法
CN109523195B (zh) 基于样本多模态分类的分层式非高斯算法的故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant