CN110009126A - 基于pls模型与pca贡献度融合的在线报警分析方法 - Google Patents
基于pls模型与pca贡献度融合的在线报警分析方法 Download PDFInfo
- Publication number
- CN110009126A CN110009126A CN201910064101.8A CN201910064101A CN110009126A CN 110009126 A CN110009126 A CN 110009126A CN 201910064101 A CN201910064101 A CN 201910064101A CN 110009126 A CN110009126 A CN 110009126A
- Authority
- CN
- China
- Prior art keywords
- variable
- contribution
- variables
- real
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 149
- 230000008569 process Effects 0.000 claims abstract description 93
- 238000012544 monitoring process Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000000513 principal component analysis Methods 0.000 claims description 53
- 230000004927 fusion Effects 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012847 principal component analysis method Methods 0.000 claims description 6
- 230000000903 blocking effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000011002 quantification Methods 0.000 claims description 4
- 238000001311 chemical methods and process Methods 0.000 abstract description 16
- 238000001514 detection method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 20
- 239000000047 product Substances 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 239000000498 cooling water Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000000491 multivariate analysis Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000000376 reactant Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000238097 Callinectes sapidus Species 0.000 description 1
- 101000661816 Homo sapiens Suppression of tumorigenicity 18 protein Proteins 0.000 description 1
- 101000972853 Hordeum vulgare Non-specific lipid-transfer protein 3 Proteins 0.000 description 1
- 102100025297 Mannose-P-dolichol utilization defect 1 protein Human genes 0.000 description 1
- 101710089919 Mannose-P-dolichol utilization defect 1 protein Proteins 0.000 description 1
- 101000900567 Pisum sativum Disease resistance response protein Pi49 Proteins 0.000 description 1
- 101100438139 Vulpes vulpes CABYR gene Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003889 chemical engineering Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000012263 liquid product Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 101150075118 sub1 gene Proteins 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B25/00—Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems
- G08B25/007—Details of data content structure of message packets; data protocols
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Emergency Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于PLS模型与PCA贡献度融合的在线报警分析方法,包括:获取工业数据,根据工业流程对整体系统进行分块处理,根据多关联模块偏最小二乘法分别对子模块进行建模分析,根据主元分析法获得每个子模块对整体系统的实时贡献度,根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度,根据关键变量提取方式对变量进行筛选,以获得具有预设贡献度的变量,根据在线根源分析策略获得过程变量实时重要程度,根据过程变量实时重要程度对工业报警进行管理。本发明提供的技术方案实现了化工过程监控和报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力的目标。
Description
技术领域
本发明涉及工业报警技术领域,尤其涉及一种基于PLS模型与PCA贡献度融合的在线报警分析方法。
背景技术
报警系统是流程工业监控中的一个重要组成部分,通过报警系统发出警报,可以使操作员实时地掌握设备运行的状况,及时察觉到异常的运行工况。通过报警管理系统,可以提高报警系统的真实性和可靠性。报警管理系统涵盖了一个完整的生命周期:理念、识别、合理化、设计、实施、运行等。
报警系统是化工过程安全的重要保障,报警信息准确、响应速度快是报警系统最重要的两个指标。传统工业中,滤波、死区、延迟等单变量阈值报警方法得到了广泛的应用,但是由于复杂工业中变量数过多,各个变量之间是相互影响,特别是当故障发生时,由于系统内部的相互作用关系,再加上一些冗余报警的设置,会出现很多报警,使人难以辨别真实的源头,从而产生报警泛滥现象。这种现象产生的大量报警远远超出了操作员的处理能力,从而忽略了关键报警,所以如何有效合理的减少报警具有重要的意义。因此,在系统产生安全隐患的时刻,过多变量同时报警产生了报警泛滥的现象,报警信息单一、分析困难成为了单变量阈值报警的弊病。从报警阈值优化角度来解决的报警泛滥问题,有效地提高了报警系统的性能,但是没有能够从根本上解决问题。
发明内容
为解决现有技术存在的局限和缺陷,本发明提供一种基于PLS模型与PCA贡献度融合的在线报警分析方法,包括:
获取工业数据;
根据工业流程和所述工业数据对整体系统进行分块处理;
根据多关联模块偏最小二乘法分别对子模块进行建模分析,以获得工业数据子模块构造和子模块的过程监控结果;
根据主元分析法获得每个子模块对整体系统的实时贡献度;
根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度;
根据关键变量提取方式对所述变量进行筛选,以获得具有预设贡献度的变量;
根据在线根源分析策略获得过程变量实时重要程度,所述过程变量实时重要程度用于在线评价变量关键程度的重要指标;
根据所述过程变量实时重要程度对工业报警进行管理。
可选的,所述根据多关联模块偏最小二乘法分别对子模块进行建模分析的步骤包括:
根据偏最小二乘法形成Xa*n与Yb*n变量模型,所述变量模型为:
其中,Xa*n是输入变量,Yb*n是输出变量,a、b分别为输入变量和输出变量的个数,n为采样个数,Tp*n为X的主元潜在变量,Up*n为Y的主元潜在变量,P、Q分别为X、Y投影到主元空间的投影矩阵,EX、EY分别为X、Y主元空间残差项;
根据主元变量T形成主元变量预测模型,用于预测主元变量U,所述主元变量预测模型为:
U=TBT+ETU (2)
其中,B为回归矩阵,ETU的最小化函数是偏最小二乘法的目标函数;
根据公式(1)和公式(2)获得输出Y的预测模型:
Y=TBQT+ETY (3)
其中,ETY为整体模型的残差;
获得任意时刻主元潜在变量LV:
LVi=XkiPBQT (4)
其中,k为主元变量个数。
可选的,所述根据主元分析法获得每个子模块对整体系统的实时贡献度的步骤包括:
对每个子模块进行偏最小二乘计算:
其中,LVi为第i维潜在变量,为LVi的方差,Wj,i=PBQT为投影矩阵的第(j,i)元素;
获得任意时刻各个子模块的各个变量对于所述子模块的贡献度ConS(s,j,i),所述贡献度ConS(s,j,i)为:
其中,贡献度ConS(s,j,i)表示第s个子模块在第i个采样下第j个变量的贡献度。
可选的,所述根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度的步骤包括:
对数据集合R进行主元分析法建模:
其中,数据集合R=[R1 Λ Ri Λ Rs],Ri是第i个子集在某一时刻的T2值,PR为数据集合R的主元空间投影矩阵;
获得Ri对于TR的任意时刻的贡献度conR(s,i),所述贡献度conR(s,i)为:
其中,贡献度conR(s,i)表示i时刻第s个子模块对整体系统的贡献度;
获得子模块的各个变量对整体系统的贡献度conz(n,i),所述贡献度conz(n,i)为:
其中,u为子模块个数,n为变量个数。
可选的,所述根据关键变量提取方式对所述变量进行筛选的步骤包括:
根据三西格玛规则对所述变量进行筛选:
其中,表示在第j个采样点各个变量的贡献度变化率序列的方差;
所述根据在线根源分析策略获得过程变量实时重要程度的步骤包括:
根据量化公式对各个变量的实时重要程度进行量化,所述量化公式为:
其中,score(i,j)表示在第i个采样下第j个变量的实时重要程度。
本发明具有下述有益效果:
本发明提供的基于PLS模型与PCA贡献度融合的在线报警分析方法,包括:获取工业数据,根据工业流程和工业数据对整体系统进行分块处理,根据多关联模块偏最小二乘法分别对子模块进行建模分析,以获得工业数据子模块构造和子模块的过程监控结果,根据主元分析法获得每个子模块对整体系统的实时贡献度,根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度,根据关键变量提取方式对变量进行筛选,以获得具有预设贡献度的变量,根据在线根源分析策略获得过程变量实时重要程度,过程变量实时重要程度用于在线评价变量关键程度的重要指标,根据过程变量实时重要程度对工业报警进行管理。本发明提供的技术方案实现了化工过程监控和报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力的目标。
附图说明
图1为本发明实施例一提供的TE过程的流程图。
图2为本发明实施例一提供的工作流程图。
图3为本发明实施例一提供的子模块划分示意图。
图4为本发明实施例一提供的对于TE过程故障4的PCA与MCB-PLS检测结果图。
图5为本发明实施例一提供的对于TE过程故障4的传统的PCA和MCB-PLS主元分布图。
图6为本发明实施例一提供的对于TE过程故障4的PCA和MCB-PLS报警识别贡献图。
图7为本发明实施例一提供的对于TE过程故障4的在线根源分析报警策略效果图。
图8为本发明实施例二提供的对于TE过程故障10的PCA与MCB-PLS检测结果图。
图9为本发明实施例二提供的对于TE过程故障10的传统的PCA和MCB-PLS主元分布图。
图10为本发明实施例二提供的对于TE过程故障10的PCA和MCB-PLS报警识别贡献图。
图11为本发明实施例二提供的对于TE过程故障10的在线根源分析报警策略效果图。
具体实施方式
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的基于PLS模型与PCA贡献度融合的在线报警分析方法进行详细描述。
实施例一
随着大数据时代的发展,复杂工业中大量数据的获取,计算机处理数据能力的提升促进了多变量分析方法的快速发展,基于多元统计的方法,例如主元分析法(PrincipalComponent Analysis,PCA)、偏最小二乘(Partial Least Squares,PLS)、规范变量分析(canonical variate analysis,CVA)等也广泛应用于报警系统。由于化工过程的复杂性以及变量过多的因素,多变量分析方法也未能应对实际工业提出可解释的分析结果,针对报警系统仍然存在诸多问题。
传统的PCA方法按照方差最大化的方向进行降维,提取装置的特征进行过程监控,进行了有效的故障检测。由于PCA方法没有重视化工过程中输入输出之间的关系,通过PLS方法进行建模,最大化输入变量与输出变量之间的关系,得到了更准确的检测结果。通过考虑化工流程的时序性特征,通过CVA算法可以更加准确地捕捉到过程信息。PCA、PLS、CVA等多元统计方法共同的问题就是无法准确地检测非线性故障。为了解决上述问题,基于kernel的方法,例如KPCA、KICA、KPLS等方法通过高维空间分类有效地检测到了非线性故障,但是核函数的计算负担很重,需要较高计算能力的支持,因此基于核函数的方法在当前工业实际中未能得到有效地推广。
工业自动化发展的初期,工厂设备多以单变量阈值报警为主,报警信息呈现简单的0-1序列,由于没有考虑过程变量的相关性,因此该报警设置方法提供的报警信息少而且报警泛滥现象严重。随着数据驱动方法的研究发展,通过拓扑结构分析报警信息的根源但是这种单纯使用结构进行溯源的方法准确性不能得以保证。贝叶斯网络分析方法,通过后验概率的推导求得报警信息的根源,通过这样的方法来减少报警泛滥问题,增加报警信号的可解释性。通过分析PCA的主元变量和原始数据的关系,得到了原始变量对于当前过程状态的贡献程度,形成了报警贡献可视化的雏形。由于传统的PCA贡献度无法适应时序序列进行分析,通过分解贡献度的计算方法,设计2D贡献图方法分析每一时刻各变量对于整体系统的贡献度,在实际化工过程中得以应用。然而,基于贡献度分析的方法在变量过多的情况下,都会受到噪声爆炸的影响,同时产生多个关键报警变量或根源变量,无法提供准确的报警分析结果。
为改善现有技术存在的局限和缺陷,本实施例提供一种基于PLS模型与PCA贡献度融合的在线报警分析方法,用以实现化工过程监控及报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力。本实施例根据流程化工过程知识将该过程所有变量划分为s个子模块,考虑到流程工业的能量、物料传递性,设计并使得连续子模块具有相同的变量,前一个子模块的输出作为后一个子模块的输入,第s个子模块的输出作为该化工流程的整体输出。
本实施例中,假设Xa*n是输入变量,Yb*n是输出变量,其中a、b分别为输入变量和输出变量的个数,n为采样个数。使用PLS方法构建Xa*n与Yb*n变量模型:
其中,Tp*n为X的主元潜在变量(LV),Up*n为Y的主元潜在变量(LV),P、Q分别为X、Y投影到主元空间的投影矩阵,EX、EY分别为X、Y主元空间残差项。为了输入输出关系的最大化,通过主元变量T预测主元变量U,从而构建模型如下:
U=TBT+ETU (2)
其中,B为回归矩阵,ETU的最小化函数是PLS的目标函数,通过均方误差(MeanSquared Error,MSE)判断训练过程中预测准确度。根据公式(1)和公式(2)获得输出Y的预测模型:
Y=TBQT+ETY (3)
其中,ETY为整体模型的残差,在每个时刻主元潜在变量LV:
LVi=XkiPBQT (4)
其中,k为主元变量个数,在过程监控部分对潜在变量LVs,根据T2指标进行监控,通过99%置信区间求取阈值线。
经过PLS的分析,在过程系统产生故障的情况下,通过得分矩阵T算出的T2统计量产生异常值,对于传统的故障分析而言,PLS仅仅可以用于故障检测,无法对于故障的根源进行有效地分析。2D贡献图在PLS的基础上,分析Xa*n中每一维变量对于潜在变量产生的影响,从而得到LV和观测值X。对于每个子模块进行PLS计算:
其中,LVi为第i维潜在变量,为LVi的方差,Wj,i=PBQT为投影矩阵的第(j,i)元素。获得任意时刻各个子模块的各个变量对于所述子模块的贡献度ConS(s,j,i),所述贡献度ConS(s,j,i)为:
其中,贡献度ConS(s,j,i)表示第s个子模块在第i个采样下第j个变量的贡献度。传统的PLS贡献度方法在应对多变量的情况时,容易受到变量间噪声的干扰。原始的Multi-Block PLS方法在进行分块的时候没有考虑子模块间相关性,丢失部分数据信息,导致分析结果不够准确。本实施例提出的MCB-PLS可以有效解决这个问题,类似于传统的MB-PLS,首先根据化工流程知识对于所有变量进行子模块划分。
图3为本发明实施例一提供的子模块划分示意图。其中图3(a)为传统的MB-PLS对于子模块的划分,主要依据能量传递方向或者反应、分离等设备模块进行选择。这种模块划分方法往往丢失了模块间的连续性。图3(b)为MCB-PLS的子模块划分方法,其中每两个子模块包含共有变量,共有变量作为前一子模块中的输出,同时作为下一模块中的输入,最后一个模块的输出设定为整体化工流程的产出的测量变量。在图3(b)中,sub1包含了X1、X2、X3、Y1,其中X1、X2、X3为Sub1PLS的输入变量,Y1为Sub1PLS的输出变量,Sub2包含了Y1、X4、Y2,其中Y1、X4为Sub2PLS的输入变量,Y2为Sub2PLS的输出变量。
在实际工业过程中,测量变量和控制变量分别采用该方式进行分块,本实施例提出的子模块构造方式结合PLS对输入输出之间的预测,考虑了化工装置各个单元之间的连续性,更多地保留了数据信息。
本实施例为计算各个子模块对整体过程的影响,构建数据集合R=[R1 Λ Ri ΛRs],其中Ri是第i个子集在某一时刻的T2值,对数据集合R进行PCA建模:
其中,PR为数据集合R的主元空间投影矩阵,计算Ri对于TR的每个时刻的贡献度如下:
其中,贡献度conR(s,i)表示i时刻第s个子模块对整体过程的贡献度,根据公式(9)计算子模块中各个变量(位号)对于整体过程的贡献度:
其中,u代表子模块个数,n为变量个数。MCB-PLS的过程监控策略为:若任意一个PLS子模块T2值或整体PCA模块T2值超过控制线,产生报警;若所有PLS子模块T2值和整体PCA模块T2值均未超过控制线,过程安全。本实施例使用公式(9)计算的各个变量贡献度conz表示某一变量的变化率对整体系统的影响。
本实施例通过公式(10)进行3sigma规则筛选:
其中,表示在第j个采样点各个变量贡献度变化率序列的方差。为了在实际工业应用中保留关键变量信息,本实施例使用在线迭代方法改善工业报警,根据公式(11)量化各个变量的重要性:
其中,初始值设置为0。根据公式(9)得到的得分值,首先计算最先产生异常波动的变量,并将该变量视为根变量。假设采样间隔为1秒,变量的分数在无异常10秒后清除为0,而且工作人员的操作反应时间确定10秒的设置,并且报警最多每分钟处理6次。在线监控过程中,当根变量发生变化时,原始根变量将在十次采样后返回到零,并且将重新生成新的最重要的变量。本实施例提出的基于PLS模型与PCA贡献度融合的在线报警分析方法,可以实时有效地反映关键变量和根变量,为实际工业运营提供更多可分析信息,有效改善工业报警状态。
图1为本发明实施例一提供的TE过程的流程图。TE过程(Tennessee EastmanProcess)是一个实际化工过程的仿真模拟。TE过程模型主要被用来进行装置控制方案的设计,例如多变量控制、优化、模型预测控制、非线性控制、过程故障诊断、教学等。本实施例在TE过程模型上进行多工况自动切换系统的研究和开发,为后续的实际生产装置的多工况自动切换系统积累开发经验。
本实施例提供的基于PLS模型与PCA贡献度融合的在线报警分析方法,包括:获取工业数据,根据工业流程和工业数据对整体系统进行分块处理,根据多关联模块偏最小二乘法分别对子模块进行建模分析,以获得工业数据子模块构造和子模块的过程监控结果,根据主元分析法获得每个子模块对整体系统的实时贡献度,根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度,根据关键变量提取方式对变量进行筛选,以获得具有预设贡献度的变量,根据在线根源分析策略获得过程变量实时重要程度,过程变量实时重要程度用于在线评价变量关键程度的重要指标,根据过程变量实时重要程度对工业报警进行管理。本实施例提供的技术方案实现了化工过程监控和报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力的目标。
表1 TE过程中21个故障的描述
本实施例中,整个过程主要包含五个操作单元:反应器、冷凝器、循环压缩机、分离器和汽提塔。气态反应物进入反应器,生成液态产物,反应速率服从反应动力学中的Arrhenius函数。产物和残余反应物经过冷凝器冷却后进入汽液分离器,分离得到的气体通过压缩机进入循环管道,与新鲜进料混合送入反应器循环使用,分离得到的液体经过管道10进入汽提塔进行精制,从汽提塔底得到的流股中主要包含TE过程的产物G和H,送至下游过程。TE过程总共包括12个操纵变量和41个测量变量。根据产物中G和H的质量比的不同,TE过程有7种标准的运行模式或工况。
在TE过程中,XMEAS(1-41)为41个观测变量,其中XMEAS(1-22)共22个变量为主要观测变量,XMV(1-12)为12个控制变量,其中XMV(1-11)共11个变量为主要控制变量。
本实施例采用33个主要变量(22个观测变量与11个控制变量)用于报警分析。正常工况仿真数据集共500个采样点,故障工况数据集共有21种,每个数据集有960个采样点,其中前160个采样点依然为正常工况,各个故障和本发明使用的主要观测变量如表1和表2所示:
表2 TE过程中22个测量变量的描述
变量序号 | 变量符号 | 变量名 |
FF1 | XMEAS(1) | A流量(物流1) |
FF2 | XMEAS(2) | D流量(物流2) |
FF3 | XMEAS(3) | E流量(物流3) |
FF4 | XMEAS(4) | 总流量(物流4) |
CF5 | XMEAS(5) | 回收流量(物流8) |
RF6 | XMEAS(6) | 反应器进料率(物流6) |
RP7 | XMEAS(7) | 反应器压力 |
RL8 | XMEAS(8) | 反应器液位 |
RT9 | XMEAS(9) | 反应器温度 |
PR10 | XMEAS(10) | 放空率(物流9) |
ST11 | XMEAS(11) | 产品分离器温度 |
SL12 | XMEAS(12) | 产品分离器液位 |
SP13 | XMEAS(13) | 产品分离器压力 |
SF14 | XMEAS(14) | 产品分离器出口流量(物流10) |
SL15 | XMEAS(15) | 汽提塔液位 |
SP16 | XMEAS(16) | 汽提塔压力 |
SF17 | XMEAS(17) | 汽提塔出口流量(物流11) |
ST18 | XMEAS(18) | 汽提塔温度 |
SF19 | XMEAS(19) | 汽提塔蒸汽温度 |
CW20 | XMEAS(20) | 压缩机工作功率 |
RT21 | XMEAS(21) | 反应器冷却水出口温度 |
ST22 | XMEAS(22) | 分离器冷却水出口温度 |
本实施例中,依据生产流程中对于进料、反应器、冷凝器、压缩机、放空、分离器和汽提塔的分别,将TE模型进行分类,其中重叠的变量如表3所示分别作为前一子模块的输出和当前子模块的输入。
表3 TE模型的分块
本实施例中,实际可用的报警策略必须建立在准确的报警检测上,基于多元统计的方法重点在于故障数据和正常数据的分离。本实施例通过两个故障来比较本实施例提出的基于PLS模型与PCA贡献度融合的在线报警分析方法与广泛应用于工厂的PCA方法的性能。
故障4是反应器冷却水的进料温度改变问题,这是源于冷却水流量出现了问题,该故障是一个简单的阶跃故障。图4为本发明实施例一提供的对于TE过程故障4的PCA与MCB-PLS检测结果图。图4(a)是传统PCA方法对于故障4的检测结果,通过图4(a)可知传统的PCA准确的检测到了大部分的故障,并且产生了报警。根据仿真计算,PCA的漏报率为5%,但是传统的PCA容易受到多变量噪声的干扰,因此误报率高达21.88%。反观本实施例提供的MCB-PLS方法,图4(b)、图4(c)、图4(d)和图4(e)分别为四个子模块的检测结果,其中图4(b)、图4(d)和图4(e)都检测到了波动,图4(f)为整体过程的检测结果,精准的检测到了故障4的发生,漏报率和误报率分别为0%和4.37%,可知本实施例提出的MCB-PLS方法优于传统的PCA方法。
图5为本发明实施例一提供的对于TE过程故障4的传统的PCA和MCB-PLS主元分布图。图5(a)和图5(b)分别为传统PCA和MCB-PLS前三维主元的分布,其中红色点(灰度较浅)为前160个正常采样,蓝色点(灰度较深)为后800个故障采样。由该图可以明显地发现,本实施例提出的MCB-PLS方法更加适应于复杂流程工业的数据分析,拥有更强大的数据分离能力,更有利于过程监控。通过故障4的检测结果,可以直观地发现,MCB-PLS已经初步定位了故障发生在第四子模块中,通过报警贡献图来进行报警的识别,IDV4准确的根源报警是XMV(10)。
图6为本发明实施例一提供的对于TE过程故障4的PCA和MCB-PLS报警识别贡献图。其中,图6(a)是PCA贡献度方法对于IDV4的分析结果,上半图为实时的贡献度分析,结果是十分混乱的,但是下半图得到了报警关键变量为XMV(10),可是还有6个变量的贡献度也异于其他变量,因此在实际工业的分析中,传统的PCA分析方法不能给出准确的结果。图6(b)、6(c)、6(d)、6(e)分别为MCB-PLS的四个子模块内的变量贡献度分析结果,图6(f)为4个子模块在整体过程中影响报警的比重,可以直观的发现第四个子模块是导致故障的根源,图6(g)为整合后的贡献度分析,可以直观地看到XMV(10)为报警根源,本实施例提出的MCB-PLS方法排除了其他变量的干扰,在实际工业应用中更加可靠。
图7为本发明实施例一提供的对于TE过程故障4的在线根源分析报警策略效果图。通过该图可以发现,报警发生后,由于XMV(10)的问题一直没有得到解决,所以该变量的警示程度越来越高。若报警得到消除,则该变量的警示程度在10秒后重置为0,当其他报警产生时,新的关键变量会重新被逐渐加重警示程度。因此,本实施例提出的在线根源变量分析策略可以有效地应用于实际工业过程。本实施例提供的技术方案实现了化工过程监控和报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力的目标。
实施例二
故障10是TE过程自带的一个随机故障,其主要故障问题产生于C物料进料流量。由于该故障随机性较重,因此产生了大量的噪声,严重影响到了多变量统计方法的分析结果。图8为本发明实施例二提供的对于TE过程故障10的PCA与MCB-PLS检测结果图。图8(a)是传统方法对于故障10的检测结果,可以发现在160时刻,PCA检测到了该故障的发生,但是在400-500时刻,由于故障变化的不确定性,传统PCA方法产生了漏报的现象。根据仿真结果,PCA方法对于故障10的漏报率和误报率分别是19.63%和25.62%。反观本实施例提出的MCB-PLS方法,图8(b)至图8(e)分别是四个子模块的检测结果,可见子集3对于故障的检测更为准确,图8(f)为MCB-PLS方法的整体检测结果,该方法的漏报率和误报率分别是9.25%和9.38%。因此本实施例提出的MCB-PLS方法在检测精度上要优于传统PCA方法。
图9为本发明实施例二提供的对于TE过程故障10的传统的PCA和MCB-PLS主元分布图。如图9所示,本实施例提出的方法在数据分离能力上依然具有卓越的表现,其中图9(a)是传统PCA对数据分离结果,图9(b)是MCB-PLS对数据的分离结果,红色(灰度较浅)为正常数据点,蓝色(灰度较深)为异常数据点。
本实施例获得故障10的检测结果之后,首先可以直观地发现,MCB-PLS已经初步定位了故障发生在子集3里。图10为本发明实施例二提供的对于TE过程故障10的PCA和MCB-PLS报警识别贡献图。其中,图10(a)是PCA贡献图对于故障10的识别结果,根据PCA的结果显示,共9个变量需要被关注,这就意味着报警信息传递不准确,不能达到理想的效果。图10(b)、10(c)、10(d)、10(e)分别为MCB-PLS的四个子模块内的变量贡献度分析结果,图10(f)为4个子模块在整体过程中影响报警的比重,可以直观的发现第三个子模块是导致故障的根源,图10(g)为整合后的贡献度分析,图中显示XMEAS(13)、XMEAS(16)、XMEAS(18)和XMEAS(19)四个变量需要被重点关注,因此报警信息获得了更加准确的表达,减少了实际操作中的工作量。
图11为本发明实施例二提供的对于TE过程故障10的在线根源分析报警策略效果图。可知在前200时刻,XMEAS(1)和XMEAS(5)需要被重点关注,当故障发生后,XMEAS(13)、XMEAS(16)、XMEAS(18)和XMEAS(19)四个变量成为了影响系统的关键变量,在第720个采样点的是,XMEAS(16)已经变红(灰度加深),需要立即处理。
为了对本实施例提出的方法的检测能力有直观的描述,表4说明了PCA和MCB-PLS对于21个故障的漏报率误报率以及二者累和,可以清晰地表明本实施例提出的方法拥有更强的故障检测能力。
表4 TE过程中21个故障PCA和MCB-PLS的检测结果
本实施例提供的基于PLS模型与PCA贡献度融合的在线报警分析方法,包括:获取工业数据,根据工业流程和工业数据对整体系统进行分块处理,根据多关联模块偏最小二乘法分别对子模块进行建模分析,以获得工业数据子模块构造和子模块的过程监控结果,根据主元分析法获得每个子模块对整体系统的实时贡献度,根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度,根据关键变量提取方式对变量进行筛选,以获得具有预设贡献度的变量,根据在线根源分析策略获得过程变量实时重要程度,过程变量实时重要程度用于在线评价变量关键程度的重要指标,根据过程变量实时重要程度对工业报警进行管理。本实施例提供的技术方案实现了化工过程监控和报警管理过程中降低多变量间噪声干扰、提供更加准确过程信息、提升报警数据在线分析能力的目标。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (5)
1.一种基于PLS模型与PCA贡献度融合的在线报警分析方法,其特征在于,包括:
获取工业数据;
根据工业流程和所述工业数据对整体系统进行分块处理;
根据多关联模块偏最小二乘法分别对子模块进行建模分析,以获得工业数据子模块构造和子模块的过程监控结果;
根据主元分析法获得每个子模块对整体系统的实时贡献度;
根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度;
根据关键变量提取方式对所述变量进行筛选,以获得具有预设贡献度的变量;
根据在线根源分析策略获得过程变量实时重要程度,所述过程变量实时重要程度用于在线评价变量关键程度的重要指标;
根据所述过程变量实时重要程度对工业报警进行管理。
2.根据权利要求1所述的基于PLS模型与PCA贡献度融合的在线报警分析方法,其特征在于,所述根据多关联模块偏最小二乘法分别对子模块进行建模分析的步骤包括:
根据偏最小二乘法形成Xa*n与Yb*n变量模型,所述变量模型为:
其中,Xa*n是输入变量,Yb*n是输出变量,a、b分别为输入变量和输出变量的个数,n为采样个数,Tp*n为X的主元潜在变量,Up*n为Y的主元潜在变量,P、Q分别为X、Y投影到主元空间的投影矩阵,EX、EY分别为X、Y主元空间残差项;
根据主元变量T形成主元变量预测模型,用于预测主元变量U,所述主元变量预测模型为:
U=TBT+ETU (2)
其中,B为回归矩阵,ETU的最小化函数是偏最小二乘法的目标函数;
根据公式(1)和公式(2)获得输出Y的预测模型:
Y=TBQT+ETY (3)
其中,ETY为整体模型的残差;
获得任意时刻主元潜在变量LV:
LVi=XkiPBQT (4)
其中,k为主元变量个数。
3.根据权利要求1所述的基于PLS模型与PCA贡献度融合的在线报警分析方法,其特征在于,所述根据主元分析法获得每个子模块对整体系统的实时贡献度的步骤包括:
对每个子模块进行偏最小二乘计算:
其中,LVi为第i维潜在变量,为LVi的方差,Wj,i=PBQT为投影矩阵的第(j,i)元素;
获得任意时刻各个子模块的各个变量对于所述子模块的贡献度ConS(s,j,i),所述贡献度ConS(s,j,i)为:
其中,贡献度ConS(s,j,i)表示第s个子模块在第i个采样下第j个变量的贡献度。
4.根据权利要求1所述的基于PLS模型与PCA贡献度融合的在线报警分析方法,其特征在于,所述根据子模块对整体系统的实时贡献比例获得每个过程之中变量对于整体系统的贡献度的步骤包括:
对数据集合R进行主元分析法建模:
其中,数据集合R=[R1 Λ Ri Λ Rs],Ri是第i个子集在某一时刻的T2值,PR为数据集合R的主元空间投影矩阵;
获得Ri对于TR的任意时刻的贡献度conR(s,i),所述贡献度conR(s,i)为:
其中,贡献度conR(s,i)表示i时刻第s个子模块对整体系统的贡献度;
获得子模块的各个变量对整体系统的贡献度conz(n,i),所述贡献度conz(n,i)为:
其中,u为子模块个数,n为变量个数。
5.根据权利要求1所述的基于PLS模型与PCA贡献度融合的在线报警分析方法,其特征在于,所述根据关键变量提取方式对所述变量进行筛选的步骤包括:
根据三西格玛规则对所述变量进行筛选:
其中,表示在第j个采样点各个变量的贡献度变化率序列的方差;
所述根据在线根源分析策略获得过程变量实时重要程度的步骤包括:
根据量化公式对各个变量的实时重要程度进行量化,所述量化公式为:
其中,score(i,j)表示在第i个采样下第j个变量的实时重要程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910064101.8A CN110009126B (zh) | 2019-01-23 | 2019-01-23 | 基于pls模型与pca贡献度融合的在线报警分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910064101.8A CN110009126B (zh) | 2019-01-23 | 2019-01-23 | 基于pls模型与pca贡献度融合的在线报警分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110009126A true CN110009126A (zh) | 2019-07-12 |
CN110009126B CN110009126B (zh) | 2021-10-01 |
Family
ID=67165466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910064101.8A Active CN110009126B (zh) | 2019-01-23 | 2019-01-23 | 基于pls模型与pca贡献度融合的在线报警分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110009126B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768366A (zh) * | 2020-05-20 | 2020-10-13 | 深圳迈瑞生物医疗电子股份有限公司 | 超声成像系统、bi-rads分级方法及模型训练方法 |
CN111915855A (zh) * | 2020-07-20 | 2020-11-10 | 浙江浙能台州第二发电有限责任公司 | 用于百万千瓦超超临界机组报警系统的报警分析方法 |
CN111983997A (zh) * | 2020-08-31 | 2020-11-24 | 北京清大华亿科技有限公司 | 一种基于耦合性分析的控制回路性能监测方法及系统 |
CN117371821A (zh) * | 2023-11-28 | 2024-01-09 | 广州市中大信息技术有限公司 | 基于bim技术的企业数据可视化展示方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824137A (zh) * | 2014-03-20 | 2014-05-28 | 北京信息科技大学 | 一种复杂机械设备多工况故障预测方法 |
CN103853152A (zh) * | 2014-03-21 | 2014-06-11 | 北京工业大学 | 一种基于ar-pca的间歇过程故障监测方法 |
CN104572623A (zh) * | 2015-01-12 | 2015-04-29 | 上海交通大学 | 一种在线lda模型的高效数据总结分析方法 |
CN106156161A (zh) * | 2015-04-15 | 2016-11-23 | 富士通株式会社 | 模型融合方法、模型融合设备和分类方法 |
CN107632592A (zh) * | 2017-09-01 | 2018-01-26 | 南通大学 | 基于高效递推核主元分析的非线性时变过程故障监测方法 |
CN108958226A (zh) * | 2018-08-08 | 2018-12-07 | 太原理工大学 | 基于生存信息势—主成分分析算法的te过程故障检测方法 |
CN109189028A (zh) * | 2018-10-15 | 2019-01-11 | 江南大学 | 基于多块信息提取的pca故障诊断方法 |
-
2019
- 2019-01-23 CN CN201910064101.8A patent/CN110009126B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824137A (zh) * | 2014-03-20 | 2014-05-28 | 北京信息科技大学 | 一种复杂机械设备多工况故障预测方法 |
CN103853152A (zh) * | 2014-03-21 | 2014-06-11 | 北京工业大学 | 一种基于ar-pca的间歇过程故障监测方法 |
CN104572623A (zh) * | 2015-01-12 | 2015-04-29 | 上海交通大学 | 一种在线lda模型的高效数据总结分析方法 |
CN106156161A (zh) * | 2015-04-15 | 2016-11-23 | 富士通株式会社 | 模型融合方法、模型融合设备和分类方法 |
CN107632592A (zh) * | 2017-09-01 | 2018-01-26 | 南通大学 | 基于高效递推核主元分析的非线性时变过程故障监测方法 |
CN108958226A (zh) * | 2018-08-08 | 2018-12-07 | 太原理工大学 | 基于生存信息势—主成分分析算法的te过程故障检测方法 |
CN109189028A (zh) * | 2018-10-15 | 2019-01-11 | 江南大学 | 基于多块信息提取的pca故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
张泽宇: "基于主元分析与偏最小二乘的故障诊断方法研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768366A (zh) * | 2020-05-20 | 2020-10-13 | 深圳迈瑞生物医疗电子股份有限公司 | 超声成像系统、bi-rads分级方法及模型训练方法 |
CN111915855A (zh) * | 2020-07-20 | 2020-11-10 | 浙江浙能台州第二发电有限责任公司 | 用于百万千瓦超超临界机组报警系统的报警分析方法 |
CN111915855B (zh) * | 2020-07-20 | 2022-11-11 | 浙江浙能台州第二发电有限责任公司 | 用于百万千瓦超超临界机组报警系统的报警分析方法 |
CN111983997A (zh) * | 2020-08-31 | 2020-11-24 | 北京清大华亿科技有限公司 | 一种基于耦合性分析的控制回路性能监测方法及系统 |
CN111983997B (zh) * | 2020-08-31 | 2021-07-20 | 北京清大华亿科技有限公司 | 一种基于耦合性分析的控制回路性能监测方法及系统 |
CN117371821A (zh) * | 2023-11-28 | 2024-01-09 | 广州市中大信息技术有限公司 | 基于bim技术的企业数据可视化展示方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110009126B (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009126B (zh) | 基于pls模型与pca贡献度融合的在线报警分析方法 | |
CN103914064B (zh) | 基于多分类器和d-s证据融合的工业过程故障诊断方法 | |
EP2171598B1 (en) | Fuzzy classification approach to fault pattern matching | |
Raich et al. | Diagnosis of process disturbances by statistical distance and angle measures | |
US8732100B2 (en) | Method and apparatus for event detection permitting per event adjustment of false alarm rate | |
JP5179086B2 (ja) | 工業プロセスの監視方法及び監視システム | |
CN107272667B (zh) | 一种基于平行的偏最小二乘法的工业过程故障检测方法 | |
CN101403923A (zh) | 基于非高斯成分提取和支持向量描述的过程监控方法 | |
Charbonnier et al. | A weighted dissimilarity index to isolate faults during alarm floods | |
CN113673600A (zh) | 一种工业信号异常预警方法、系统、存储介质及计算设备 | |
Ji et al. | Statistical method based on dissimilarity of variable correlations for multimode chemical process monitoring with transitions | |
Robertson et al. | Topological preservation techniques for nonlinear process monitoring | |
Ge | Improved two-level monitoring system for plant-wide processes | |
Zhu et al. | Enhanced multicorrelation block process monitoring and abnormity root cause analysis for distributed industrial process: A visual data-driven approach | |
Shirshahi et al. | Diagnosing root causes of faults based on alarm flood classification using transfer entropy and multi-sensor fusion approaches | |
Monroy et al. | Enhanced plant fault diagnosis based on the characterization of transient stages | |
Maestri et al. | A robust clustering method for detection of abnormal situations in a process with multiple steady-state operation modes | |
Fei et al. | Online process monitoring for complex systems with dynamic weighted principal component analysis | |
CN112184034A (zh) | 基于互信息的多块k近邻故障监测方法及系统 | |
Morris et al. | Process performance monitoring and fault detection through multivariate statistical process control | |
Aftabi et al. | A Variational Autoencoder Framework for Robust, Physics-Informed Cyberattack Recognition in Industrial Cyber-Physical Systems | |
Lu et al. | Visual monitoring of industrial operation states based on kernel fisher vector and self-organizing map networks | |
Chetouani | Use of cumulative sum (CUSUM) test for detecting abrupt changes in the process dynamics | |
Sun et al. | A hierarchical quality-related fault diagnosis method for nonlinear industrial systems | |
Pan et al. | Root cause and fault propagation analysis based on causal graph in chemical processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |